څنګه د لوی سایټ کرال کولو لپاره او د چیغېنګ فروګ SEO سپایډر په کارولو سره ډاټا استخراج کول
موږ همدا اوس د مارکیټو مهاجرتونو سره د ډیری پیرودونکو سره مرسته کوو. لکه څنګه چې لوی شرکتونه د دې په څیر د تشبثي حلونو څخه کار اخلي، دا د سپیډر ویب په څیر دی چې د کلونو په اوږدو کې پخپله پروسو او پلیټ فارمونو کې جوړوي تر هغه چې شرکتونه حتی د هر ټچ پوائنټ څخه خبر نه وي.
د مارکیټو په څیر د تصدۍ بازار موندنې اتوماتیک پلیټ فارم سره، فورمې د سایټونو او لینډینګ پاڼو په اوږدو کې د معلوماتو د ننوتلو نقطه ده. شرکتونه ډیری وختونه د دوی په سایټونو کې زرګونه پاڼې او سلګونه فورمې لري چې باید د تازه کولو لپاره وپیژندل شي.
د دې لپاره عالي وسیله ده د فرګو SEO سپایډر ژړا کول... شاید د SEO بازار کې ترټولو مشهور پلیټ فارم د سایټ څخه د کرال کولو، پلټنې، او استخراج لپاره. د ځانګړتیاو بډایه پلیټ فارم په حقیقت کې د هرې دندې لپاره چې تاسو ورته اړتیا لرئ سلګونه اختیارونه وړاندې کوي. ځانګړتیاوې د لټون لپاره د اصلاح کولو څخه لرې غزوي، که څه هم، ستاسو د سایټ څخه د معلوماتو استخراج لپاره د یو په زړه پورې ګټور خصوصیت سره لکه څنګه چې دا کرول کیږي.
د فرګو SEO سپایډر ژړا: کرال او استخراج
د سکرینګ فرګ SEO سپایډر کلیدي ب featureه دا ده چې تاسو کولی شئ د پراساس دودیز استخراج ترسره کړئ ریجیکس, ایکس پیت، او یا CSSPath مشخصات دا خورا ګټور دی ځکه چې موږ غواړو د مراجعینو سایټونه وپلټئ او پلټنه وکړو او د پاڼو څخه د MunchkinID او FormId ارزښتونه ونیسئ.
د وسیلې سره ، خلاص کړئ تشکیلات> دود> استخراج د هغه عناصرو پیژندلو لپاره چې تاسو یې ایستل غواړئ.
د استخراج سکرین د بشپړ ډول غیر محدود معلوماتو راټولولو ته اجازه ورکوي:
ریګیکس ، ایکس پیت ، او د CSSPath استخراج
د MunchkinID لپاره، پیژندونکی د فارم سکریپټ کې موقعیت لري چې په پاڼه کې دی:
<script type='text/javascript' id='marketo-fat-js-extra'>
/* <![CDATA[ */
var marketoFat = {
"id": "123-ABC-456",
"prepopulate": "",
"ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
"popout": {
"enabled": false
}
};
/* ]]> */
موږ بیا یو د ریګکس قانون د سکریپټ ټاګ پا fromې څخه ID په نښه کول چې په پا pageه کې دننه شوي وي:
Regex: ["']id["']: *["'](.*?)["']
د فورمې ID لپاره ، ډاټا د مارکیټ فارم کې دننه آخذه کې ده:
<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">
موږ یو د ایکس پیت قانون په پاڼه کې داخل شوي فورمه کې د ID د نیولو لپاره. د XPath پوښتنه د نوم سره د ان پټ سره د فارم په لټه کې ده فورډ، بیا استخراج د ارزښت:
XPath: //form/input[@name="formid"]/@value
د انلاین سټایل ټګونه استخراج کړئ
موږ د پیرودونکي سره د سایټ پاکولو کې مرسته کوو چیرې چې دوی د ایلیمینټر پلگ ان کې انلاین سټایلونه کارولي ترڅو د پا pageې سره واقعیا هر عنصر دودیز کړي. د دې پیژندلو لپاره چې انلاین سټایلونه چیرې کارول شوي ، موږ سایټ د ګمرک استخراج لپاره د ډیری RegEx قواعدو سره سکریپ کړ:
- د سپین انلاین سټایل:
<span\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
- د اینکر ټاګ انلاین سټایل:
<a\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
- Div ټاګ انلاین سټایل:
<div\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
- د سرلیک ټګ انلاین سټایل:
<h+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
اخراجونه
At Martech Zone، موږ سایټ په مختلفو فرعي ډومینونو کې په څو ژبو کې خدمت کوو. د دې ژباړو کرول کول اړین ندي ځکه چې ټولې شتمنۍ او معلومات د اصلي سایټ پراساس دي. د دې له امله، موږ د ایستلو لیست ترتیب فعال کړ او لاندې اصول مو اضافه کړل:
.*\.martech.zone
تاسو کولی شئ دا د اضافه کولو له لارې د ټاګونو په څیر غیر ضروري لارو د ځړولو لپاره هم وکاروئ:
martech.zone/tag/.*
موږ هم نه غواړو زموږ د AMP پاڼې کرال کړو، کوم چې پای ته رسیږي ?amp=1
، نو په
https?://[^\s]+?\?amp=1
پلیټ فارم حتی د ځینې ازموینې لپاره ښه میتود لري URLs د مقرراتو خلاف د دې لپاره چې ډاډ ترلاسه کړئ چې دوی سم کار کوي مخکې له دې چې تاسو خپل سایټ کرل کړئ.
Screaming Frog SEO Spider JavaScript Rendering
د چیغې وهلو بل غوره اختیار دا دی چې تاسو محدود نه یاست د HTML په پاڼه کې، تاسو کولی شئ هر هغه جاوا سکریپټ وړاندې کړئ چې ستاسو په سایټ کې د فورمو داخلولو لپاره ځي. دننه تشکیلات> سپایډر، تاسو کولی شئ د وړاندیز کولو ټب ته لاړ شئ او دا وړ کړئ.
دا د سایټ کرول کولو لپاره لږ وخت نیسي ، البته ، مګر تاسو به داسې فورمې ترلاسه کړئ چې د جاواسکریپټ لخوا د مراجعین اړخ وړاندیز شوي وي او همدارنګه هغه ب formsې چې د سرور اړخ ته دننه شوي وي.
پداسې حال کې چې دا خورا مشخص غوښتنلیک دی ، دا خورا په زړه پورې ګټور دی ځکه چې تاسو د لوی سایټونو سره کار کوئ. تاسو به حتما وغواړئ پلټنه وکړئ چیرې چې ستاسو فارمونه په ټوله سایټ کې ځای په ځای شوي دي.
ډراونګ فرګ SEO سپایډر ډاونلوډ کړئ
د افشاء: Martech Zone پدې مقاله کې د هغې وابسته لینکونه کاروي.