InternetBlogs

Paano mag-alis ng isang site o mga fragment nito mula sa index ng Google

Ayon sa pag-index konsepto pinagtibay ng Google, alang para pagkakumpleto, kawalang-kinikilingan ng impormasyon at ang mga pag-alinsunod sa query sa paghahanap sa pagpapalabas ng mga resulta. Kung ang index ay bumaba website na may mga iligal na nilalaman, o mapagkukunan para sa spam, ang mga pahina ng site na ito ay hindi mamarkahan sa mga karaniwang database search engine. Para sa amin ito ay mahalaga upang malaman kung paano alisin ang isang site mula sa pagpapalabas ng mga resulta ng paghahanap server.

Variant ng zero-index ng Google

Sa sandaling ang mga search robot - isang programa upang mangolekta ng impormasyon tungkol sa mga bagong mapagkukunan - ii-scan ang mga pahina ng site sa pamamagitan ng pahina, pagkatapos, kapag sa ilalim ng mga kinakailangan sa patakaran ng Google para sa pag-parse, ito ay ma-index. Ngunit din namin sa iyo kung paano alisin ang iyong site o mga fragment para sa mga search engine sa pamamagitan ng isang robots.txt - index at maghanap sa parehong oras stop.

Upang ibukod mula sa pagpapalabas ng mapagkukunan bilang isang buo, sa root folder ng server na kung saan ang site ay matatagpuan, ay lumilikha ng isang tiyak na lugar ng teksto - sinabi robots.txt. zone na ito ay itinuturing na may mga search engine at kumilos ayon sa mga tagubilin basahin.

Isaisip na ang Google search engine index ang mga pahina, kahit na kung ang isang user ay may access upang tingnan ang naka-ban. Kapag ang browser ay tumugon na may 401 o 403 "Access ay hindi wasto", ito ay nalalapat lamang sa mga bisita, sa halip na mga programa na mangalap para sa search engine.

Upang maunawaan kung paano alisin ang mga site mula sa mga search engine pag-index, isang text pointer ay dapat ipasok ang sumusunod na linya:

User-agent: Googlebot

Huwag Payagan: /

Ito ay nagpapahiwatig na ang mga crawler sa index ang pagbabawal ng lahat ng nilalaman sa site. Narito kung paano alisin ang isang site sa Google, kaya na sa huli ay hindi cache ang mga mapagkukunan sa listahan ng napansin.

Embodiments ng pag-scan para sa iba't ibang mga protocol

Kung kailangan mong ilista ang mga indibidwal na mga pamantayan ng komunikasyon, na kung saan nais mong mag-apply espesyal na mga panuntunan para sa pag-index ng Google, halimbawa, nang hiwalay para sa hypertext protocol http / https, ito rin ay kinakailangan upang magrehistro sa robots.txt sa mga sumusunod na paraan (halimbawa).

(Http://yourserver.com/robots.txt) - isang pangalan ng domain ng iyong site (kahit ano)

User-agent: * - anumang search engine

Payagan: / - payagan ang buong indexation

Paano mag-alis ng isang site mula sa mga isyu na napilitan sa pamamagitan ng https protocol

(Https://yourserver.com/robots.txt):

User-agent: *

Huwag Payagan: / kumpletong ban sa pag-index

Pinabilis na pag-alis URL- resource address mula sa Google SERPs

Kung hindi mo nais na maghintay para sa muling indexation, at ang mga site na gusto mong itago tulad ng, Inirerekumenda ko na gamitin ang serbisyo http://services.google.com/urlconsole/controller lalong madaling panahon. Pre robots.txt ay may upang mailagay sa root directory ng server site. Dapat itong inireseta naaangkop na mga tagubilin.

Kung ang pointer para sa ilang kadahilanan ay hindi maaaring ma-edit sa root directory, lumikha ito ng sapat na sa folder na may mga target para sa kung saan nais mong itago mula sa mga search engine. Sa sandaling gawin mo ito at sumangguni sa mga serbisyo ng awtomatikong pag-aalis ng hypertext address, ang Google ay hindi i-scan ang mga folder na nabaybay out ng isang lamat sa robots.txt.

Ang tagal ng pagiging invisible na ito ay naka-set para sa 3 buwan. Pagkatapos ng panahong ito, ang direktoryo withdraw mula sa isyu na ito, mapapanood muli ipoproseso ng server ng Google.

H ow upang alisin ang isang site upang i-scan bahagyang

Kapag ang isang search bot ay nagbabasa ang mga nilalaman ng robots.txt, na ang ilang mga pagpapasya ay ginawa sa batayan ng mga nilalaman nito. Ipagpalagay natin na nais mong ibukod mula sa pagpapakita ang buong direktoryo na tinatawag na Anatom. Ito ay sapat na upang mag-atas ng mga naturang regulasyon:

User-agent: Googlebot

Huwag Payagan: / Anatom

O kaya, halimbawa, gusto mong hindi index ang lahat ng uri ng imahe na .gif. Upang gawin ito, idagdag ang sumusunod na listahan:

User-agent: Googlebot

Huwag Payagan: /*.gif$

Narito ang isa pang halimbawa. Ipaalam sa kanila bago matanggal sa pag-parse ng impormasyon sa mga magilas na binuo na pahina, habang ang pagdaragdag sa ang uri index entry:

User-agent: Googlebot

Huwag Payagan: / *?

Iyan ay tungkol sa, at spells out ang mga patakaran para sa mga search engine. Isa pang bagay ay na ito ay mas maginhawa upang gamitin lamang ang META tag. At mga webmaster ay madalas na gamitin lamang tulad ng isang standard na kumokontrol sa operasyon ng mga search engine. Ngunit kami ay talakayin ito sa hinaharap na mga artikulo.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 tl.atomiyme.com. Theme powered by WordPress.