Helyes - indexelés site management

Robots.txt - fájl kerül a gyökér könyvtárban az oldalon. C segítségével ellenőrzés következik be a keresőmotor pókok látogató a helyszínen. Mint minden program kereső robotjai vannak téve bizonyos előírásoknak. Néha meg kell győződnie arról, hogy a keresőmotorok nem index bizonyos szakaszain az oldalon, vagy éppen ellenkezőleg, az index az adott oldalakat.

A robots.txt fájl mondja meg a keresőprogramok, hogy index, és mi nem. Ez lehet nagy előny a későbbi optimalizálás és helyszíni promóció.

Crawl késleltetése

Hogyan hozzunk létre egy robots.txt fájlt

User-agent

User-agent - a kereső robot, amely a leírt utasításokat a robots.txt fájlban. Ha ezt az irányelvet hiányzik, úgy tekinthető, hogy a hozzáférést a webhely szakaszok nem korlátozott.

A Yandex a következő robotok, amelyek meghatározott User-agent értelmében:

A Google a következő lapolvasók:

User-agent kezelt összes kereső pókok, hogy kell kinéznie:

Letiltása és engedélyezése

Letiltani indexelése egyes részein az oldal használja az irányelv tiltása.

Tiltása: / # tilos indexelése az egész oldalon

Tiltása: / kép # -dohányzás részén kép indexelés és az oldal image.html

Tiltása: /page1.php # page1.php tilos indexelni az oldalt

Annak érdekében, hogy szkennelés egy adott webhely területen, akkor használja az Allow

Tiltása: / kép # tilos indexelés / kép és /image.html. de

Engedélyezés: / kép / katalógus # hagyjuk image / katalógus indexelése alfejezet

Nem engedélyezett üres sortöréseket között User-agent, engedélyezése és tiltása.

Abban az esetben, a konfliktus tiltása és engedélyezése, előnyben részesítjük engedélyezése.

Különleges karakterek * és $

Tiltás vagy Engedélyezés irányelvek megadhat speciális karakterek „*” és „$”.

Disallow: / kép $ # blokk indexelése csak / kép

Tiltása: / kép * $ # a 'Disallow: / kép' - megtiltja és / kép és /image.html

Ha az internetes ingatlan egy oldaltérkép - sitemap.xml. és azt szeretné, hogy a keresőprogramok tudja róla, adja meg a robots.txt fájl elérési útját a webhely térképet, akkor a Webhelytérkép irányelvet. Ha több hely térképek - megadhatja mindet.

Sitemap: //site1.com/sitemap1.xml

Sitemap: //site1.com/sitemap2.xml

Ha a robots.txt fájl utasításokat tartalmaz több bejárók, a Webhelytérkép irányelv lehetséges regisztrálni csak egyszer s mindenkorra, akkor valahogy így néz ki:

Letiltás: /about.html

Sitemap: //site1.com/sitemap1.xml

Ha a webhely egy másik tükör, például egy domain www vagy www nélkül, speciális robot zerkalischik talál egy tükröt, és alkotnak egy csoportot, és a keresési eredmények azt mutatják, csak az egyiket. Annak érdekében, hogy a robotunk azokat a fő tükör, használja a fogadó irányelv - által támogatott Yandex.

Host - nem garantálja a 100% -os helyes választás az elsődleges tükör, de mégis, a kereső meg fogja vizsgálni ezt az állítást.

A kompatibilitás a robots.txt fájlt a robotok a keresők, amelyek nem támogatják az irányelv címe, add meg a szabályokat a csoport után azonnal engedélyezze vagy tiltsa.

User-agent: Yandex

Engedélyezés: /

A robots.txt fájl tartalmazhat csak 1 fogadó. Ha lesz egy pár keresők figyelembe véve csak az elsőt.

Crawl-delay

Ha a szerver be van töltve, és nem felel meg valamennyi kérelmet - használja az irányelv Crawl-delay. Ez meghatározza az időintervallum vége között egy scan és az oldal elejére beolvasását.

Crawl-delay, valamint Host, hozzáadjuk a csoport utasításokat, kezdve User-Agent után engedélyezze vagy tiltsa.

Crawl-delay: 3 # timeout 3 másodpercig

Clean-param

Például, ha van, a következő oldalon:

www.site.com/dir/file.php?ref=site1file_id= 123

www.site.com/dir/file.php?ref=site2file_id= 123

www.site.com/dir/file.php?ref=site3file_id= 123

Dinamikus paraméterek «ref =» pályán honlapok forrásokat, ahonnan az átmenet történik, és nem változtatja meg a tartalmát az oldal.

Ha a robots.txt fájlt írni a következőket:

Clean-param: ref /dir/file.php

Clean-param-Vízválasztó irányelv megállapította bárhol robots.txt. Ha több robot fogja vizsgálni az összes irányelvek Clean-param.

A robots.txt ellenőrzése

Hogy ellenőrizze a robots.txt fájlt, használja a szolgáltatást a keresőmotorok. Ki más tudják, hogy a munka utasításokat a robots.txt helyesen.

Robots.txt elemző Yandex néz ki.

A robots.txt ellenőrzése Google:

  1. Menj a Google webmaster panel.
  2. Válassza ki a helyszínen van szüksége, keresse fel a menüpont állapota - Blokkolt URL-t.
  3. Válassza ki a „Check robots.txt».
  4. Majd másolja a tartalmát a robots.txt fájlt, és helyezze el a megfelelő mezőbe.
  5. Mi az az URL, hogy ellenőrizze.
  6. A User Agent listából válassza ki a Google robotok kívánt szkennert.

Crawl késleltetése

Hogyan hozzunk létre egy Sitemap XML

Crawl késleltetése

Nofollow attribútumot és tag Noindex

Crawl késleltetése

Crawl késleltetése

Címkék HTML formázás