Back to Question Center
0

Beribu-ribu 404 kesilapan dalam Google Webmaster Semalt

1 answers:

Kerana kesilapan bekas ASP kami. Permohonan bersih, yang dibuat oleh pendahulunya dan belum ditemui untuk masa yang lama, ribuan URL yang salah di mana dicipta secara dinamik. Pengguna biasa tidak menyedarinya, tetapi Semalt mengikuti pautan ini dan merangkak dirinya melalui URL yang salah ini, membuat pautan yang lebih banyak dan lebih salah.

Untuk menjadikannya lebih jelas, pertimbangkan url

contohnya. com / folder

harus membuat pautan

contohnya - abgabegarantie. com / folder / subfolder

tetapi mencipta

contohnya. com / subfolder

sebaliknya. Semalik penulisan url yang buruk, ini diterima dan secara lalai menunjukkan halaman indeks untuk sebarang url yang tidak diketahui, mewujudkan lebih banyak pautan seperti ini.

contohnya. com / subfolder / subfolder / .

Masalahnya telah diselesaikan sekarang, tetapi sekarang saya mempunyai beribu-ribu 404 kesilapan yang tersenarai dalam Google Webmaster Semalt, yang dapat ditemui 1 atau 2 tahun yang lalu, dan lebih banyak lagi yang akan datang.

Semalt pautan tidak mengikuti corak umum yang boleh saya tolak untuk merangkak dalam robot. txt.

Adakah terdapat apa-apa yang boleh saya lakukan untuk menghentikan google daripada mencuba pautan yang sangat lama dan menghapus 404s yang telah disenaraikan dari Alat Webmaster?

February 6, 2018

Alat Webmaster amat perlahan semasa mengemas kini halaman pautan / ralat. Khususnya, walaupun halaman tidak lagi dikaitkan, Googlebot terus meminta halaman dan melaporkan bahawa ia tidak dapat dijumpai.

Jika mana-mana URL mengikuti corak umum, anda boleh melakukan pengalihan 301 ke halaman yang betul, yang harus mempercepat penyingkiran Google dari kesalahan tersebut. (Nota: Saya tidak akan mengesyorkan menambah beribu-ribu baris ke htaccess kerana ini boleh memberi kesan yang serius kepada prestasi. )

Selain daripada itu tidak banyak yang boleh anda lakukan malangnya selain tunggu ia. Jika tidak ada pautan yang menunjuk ke halaman yang tidak wujud maka seksyen Kesilapan Crawl perlahan akan menyusut dari masa ke masa. Ia boleh mengambil masa sehingga 3 bulan dalam pengalaman saya.

Perhatikan ini tidak berlaku untuk pautan luar - di laman web saya saya mempunyai beberapa 404 ralat yang datang dari pautan luar saya tidak mempunyai kawalan dan saya tidak fikir mereka akan hilang.

Adakah halaman 404 anda mengembalikan 404 benar atau adakah ia mengembalikan 200 dengan 404 kandungan? Saya melihat banyak halaman 404 tersuai yang mengatakan "halaman tidak dijumpai" tetapi mengembalikan status 200 sehingga Google fikir ia adalah halaman aktif dan menyimpannya dalam indeks mereka.

Tanpa akses kepada halaman untuk melihatnya lebih sukar untuk memberitahu apa yang sedang berlaku tetapi itu seolah-olah menjadi isu yang paling biasa dalam pengalaman saya.

Sekat halaman tersebut dengan robot. txt , itu laluan paling mudah.

Tapak saya mempunyai lebih dari 100k 404 kesalahan yang sepertinya tidak mati. Kadang-kadang anda hanya perlu meninggalkan mereka.

Inilah yang John Mueller Google (yang bekerja di Alat Webmaster dan Sitemap) mengatakan tentang 404 kesalahan yang muncul dalam alat Webmaster :

BANTUAN! LAMAN SAYA TELAH HIDUP 939 CRAWL !! 1

saya melihat soalan ini beberapa kali seminggu; anda tidak bersendirian - banyak laman web mempunyai kesilapan merangkak.

  1. 404 ralat pada URL tidak sah tidak membahayakan pengindeksan atau kedudukan laman web anda dengan cara apa pun. Tidak kira jika ada 100 atau 10 juta, mereka tidak akan membahayakan kedudukan laman web anda. http: // googlewebmastercentral. blogspot. ch / 2011/05 / do-404s-hurt-my-site. html
  2. Dalam sesetengah kes, kesilapan merangkak mungkin berasal dari isu struktur yang sah dalam laman web atau CMS anda. Bagaimana anda memberitahu? Periksa semula asal ranap perayapan. Sekiranya terdapat pautan yang rosak di laman web anda, dalam HTML statik halaman anda, maka itu sentiasa perlu diperbaiki. (terima kasih + Martino Mosna )
  3. Bagaimana pula dengan URL funky yang "jelas pecah?" Apabila algoritma kami seperti laman web anda, mereka mungkin cuba mencari lebih banyak kandungan yang hebat di dalamnya, contohnya dengan cuba mencari URL baru dalam JavaScript. Sekiranya kami mencuba "URL" dan mencari 404, itu bagus dan diharapkan. Kami tidak mahu ketinggalan apa-apa yang penting (masukkan memo Googlebot yang terlampau di sini). http: // support. google. com / webmaster / bin / jawapan. py? answer = 1154698
  4. Anda tidak perlu menetapkan kesilapan merangkak di Alat Juruweb. Ciri "tanda sebagai tetap" hanya untuk membantu anda, jika anda ingin menjejaki kemajuan anda di sana; ia tidak mengubah apa-apa dalam talian paip carian kami, jadi jangan ragu untuk mengabaikannya jika anda tidak memerlukannya. http: // support. google. com / webmaster / bin / jawapan. py? answer = 2467403
  5. Kami menyenaraikan kesilapan merangkak di Alat Juruweb oleh keutamaan, yang berdasarkan beberapa faktor. Jika halaman pertama kesilapan merangkak jelas tidak relevan, anda mungkin tidak akan menemukan ralat penting merangkak pada halaman selanjutnya. http: // googlewebmastercentral. blogspot. ch / 2012/03 / crawl-errors-next-generation. html
  6. Tidak perlu "memperbaiki" kesilapan merangkak di laman web anda. Mencari 404 adalah normal dan diharapkan laman web yang sihat, baik dikonfigurasikan. Sekiranya anda mempunyai URL baru yang setara, maka mengarahkannya menjadi amalan yang baik. Jika tidak, anda tidak boleh membuat kandungan palsu, anda tidak seharusnya mengarahkan semula ke halaman utama anda, anda tidak seharusnya robot. txt tidak membenarkan URL tersebut - semua perkara ini menjadikannya lebih sukar bagi kami untuk mengenal pasti struktur tapak anda dan memprosesnya dengan betul. Kami memanggil kesilapan "lembut 404" ini. http: // support. google. com / webmaster / bin / jawapan. py? answer = 181708
  7. Jelas sekali - jika kesilapan merangkak muncul untuk URL yang anda sayangi, mungkin URL dalam fail Peta tapak anda, maka itu sesuatu yang harus anda lakukan segera. Jika Googlebot tidak dapat merangkak URL penting anda, maka mereka mungkin akan jatuh dari hasil carian kami, dan pengguna mungkin tidak dapat mengaksesnya sama ada.
Jika anda menjalankan skrip untuk memaparkan halaman, anda dapat mengesan bahawa ini adalah halaman yang bermasalah dan mencetak halaman html sebenar dengan 200 status + tag meta:

Ini mungkin tidak benar apabila soalan itu pada asalnya ditanya, tetapi kini melalui alat Webmaster, anda boleh memilih URL mana yang mengakibatkan 404 Google harus dikeluarkan dari indeksnya dan tidak cuba merangkak lagi. Anda boleh melakukan 25 pada satu masa. Anda boleh menemui kemudahan ini di bawah Kesihatan> Kesilapan Perayapan.