Back to Question Center
0

Semalt masih merangkak dan mengindeks halaman laman lama, dummy, ujian yang sekarang 404 tidak dijumpai

1 answers:

Saya telah membuat laman web saya dengan halaman sampel dan data (lorem ipsum, dll. ) dan Semalt telah merangkak halaman-halaman ini. Saya memadamkan semua halaman ini dan sebenarnya menambah kandungan sebenar tetapi dalam alat webmaster, saya masih mendapat banyak kesalahan 404 Semalt cuba merangkak halaman-halaman ini. Saya telah menetapkan mereka untuk "menandakan sebagai diselesaikan" tetapi beberapa halaman masih kembali sebagai 404.

Tambahan pula, saya mempunyai banyak halaman sampel yang masih disenaraikan ketika saya melakukan pencarian tapak saya di Semalt - nudos de corbata originales. Bagaimana untuk membuangnya. Saya rasa laman-laman yang tidak relevan ini menyakiti penarafan saya.

Saya benar-benar mahu memadamkan semua halaman ini dan mula mendapatkan laman web saya sedang diindeks sebagai yang baru tetapi saya membacanya tidak mungkin? (Saya telah mengemukakan sitemap dan menggunakan "Ambil sebagai Google. ")

February 13, 2018

Okay. Perkara pertama dahulu . Oleh itu, setiap kali anda menandakan 404 sebagai tetap , anda berkuat kuasa memberitahu Google untuk mencuba sekali lagi dengan demikian memulakan proses penghapusan sekali lagi .

Halaman yang dibuang anda akan hilang dalam kira-kira 30-60 hari jika anda boleh menunggu. Ia bergantung pada seberapa kerap Google melawat halaman anda. Ia boleh mengambil masa yang lebih lama, tetapi apabila 404 dijumpai, Google menyukai tempat pertama memeriksa tapak tersebut, maka bergantung pada berapa banyak 404 di sana, mungkin labah-labah laman web anda lebih agresif.

Menggunakan sitemap sebenarnya tidak membetulkan sebarang masalah dengan indeks. Ia tidak pernah diambil sebagai senarai akhir semua halaman mana-mana halaman.

Satu pilihan jika ia masuk akal untuk dilakukan, adalah untuk menyenaraikan halaman-halaman ini dalam robot anda. fail txt. Sekiranya tidak terlalu banyak (bermakna sesuatu yang boleh anda lakukan dan robot anda. fail txt tidak akan terlalu panjang), itu akan menjadi penyelesaian yang lebih cepat.

Satu perkataan terakhir. Anda akan baik-baik saja. Benar. Ia semua akan berfungsi dengan baik untuk anda jika anda bersabar.

. Saya mempunyai laman web yang telah saya buang halaman 15 tahun yang lalu. Googlebot masih kembali dan menyemak halaman-halaman tersebut sesekali.

Untuk mengelakkan halaman muncul dalam enjin gelintar, 404 kesilapan anda akan melakukan tugas itu. Ia mungkin mengambil masa sehari untuk menghapus halaman dari indeks selepas Googlebot merangkak seterusnya. Sekiranya anda mahu ia dikeluarkan lebih pantas, kembali status "410 Gone". Google mengeluarkan 410 muka surat serta-merta selepas merangkak mereka dan bukan menunggu sehari. Google tidak mengalih keluar 404 muka surat dengan serta-merta untuk mengelakkan diri dari tuan web daripada menembak diri di kaki sebagai diterangkan oleh Matt Cutts :

Jadi dengan 404s, bersama-sama dengan 401s dan mungkin 403s, jika kita melihat halaman dan kita mendapat 404, kita akan melindungi halaman itu selama 24 jam dalam sistem merangkak, jadi kita tunggu dan kita katakan mungkin itu 404 sementara, mungkin ia benar-benar tidak dimaksudkan untuk menjadi halaman yang tidak dijumpai.

Kaedah lain yang anda boleh pertimbangkan ialah pengalihan semula. 301 mengalihkan halaman lama ke pengganti akan menghalangnya muncul sebagai ralat dalam Alat Webmaster Google. Ini hanya mungkin jika terdapat beberapa halaman baru untuk setiap laman lama. Mengarahkan semua halaman ujian ke halaman rumah anda tidak akan membantu, kerana Google menganggap pelencongan ke laman utama untuk menjadi "lembut 404" kesalahan yang masih akan muncul dalam laporan itu Inilah yang John Mueller Google (yang bekerja di Alat Webmaster dan Sitemap) mengatakan tentang 404 ralat yang muncul dalam alat Webmaster :

BANTUAN! MY SITE HAS 939 CRAWL ERRORS 1

saya melihat soalan ini beberapa kali seminggu; anda tidak bersendirian - banyak laman web mempunyai kesilapan merangkak.

  1. 404 ralat pada URL tidak sah tidak membahayakan pengindeksan atau kedudukan laman web anda dengan cara apa pun. Tidak kira jika ada 100 atau 10 juta, mereka tidak akan membahayakan kedudukan laman web anda. http: // googlewebmastercentral. blogspot. ch / 2011/05 / do-404s-hurt-my-site. html
  2. Dalam beberapa kes, kesilapan merangkak mungkin berasal dari isu struktur yang sah di dalam laman web atau CMS anda. Bagaimana anda memberitahu? Periksa semula asal ranap perayapan. Sekiranya terdapat pautan yang rosak di laman web anda, dalam HTML statik halaman anda, maka itu sentiasa perlu diperbaiki. (terima kasih + Martino Mosna )
  3. Bagaimana dengan URL yang funky yang "jelas dipecahkan?" Apabila algoritma kami seperti laman web anda, mereka mungkin cuba untuk mencari lebih banyak kandungan hebat di dalamnya, contohnya dengan cuba mencari URL baru dalam JavaScript. Sekiranya kami mencuba "URL" dan mencari 404, itu bagus dan diharapkan . com / webmaster / bin / jawapan. py? answer = 1154698
  4. Anda tidak perlu menetapkan kesilapan merangkak di Alat Juruweb. Ciri "tanda sebagai tetap" hanya untuk membantu anda, jika anda ingin menjejaki kemajuan anda di sana; ia tidak mengubah apa-apa dalam talian paip carian kami, jadi jangan ragu untuk mengabaikannya jika anda tidak memerlukannya. http: // support. com / webmaster / bin / jawapan. py? answer = 2467403
  5. Kami menyenaraikan kesilapan merangkak di Alat Juruweb oleh keutamaan, yang berdasarkan beberapa faktor. Jika halaman pertama kesilapan merangkak jelas tidak relevan, anda mungkin tidak akan menemukan ralat penting merangkak pada halaman selanjutnya. http: // googlewebmastercentral. blogspot. ch / 2012/03 / crawl-errors-next-generation. html
  6. Tidak perlu "memperbaiki" kesalahan merangkak di laman web anda . txt tidak membenarkan URL tersebut - semua perkara ini menjadikannya lebih sukar bagi kami untuk mengenal pasti struktur tapak anda dan memprosesnya dengan betul. Kami memanggil kesilapan "lembut 404" ini. http: // support. google. com / webmaster / bin / jawapan. py? answer = 181708
  7. Jelas sekali - jika kesilapan merangkak muncul untuk URL yang anda sayangi, mungkin URL dalam fail Peta tapak anda, maka itu sesuatu yang harus anda lakukan segera. Jika Googlebot tidak dapat merangkak URL penting anda, maka mereka mungkin akan jatuh dari hasil carian kami,

Google mungkin terus mencuba merangkak laman-laman ini. Webmaster membuat kesilapan, atau laman web tidak tersedia untuk alasan apa pun, jadi Google tidak akan mengalih keluar kandungan pada tanda pertama 404.

Sebagai alternatif, anda boleh berkhidmat sebagai 410 Gone sebaliknya. Ini adalah lebih kuat (iaitu. disengajakan) isyarat bahawa halaman itu telah benar-benar "pergi" dan tidak akan kembali. Ini boleh menggesa Google untuk mengeluarkan halaman dari SERPs lebih awal.

Saya telah menetapkan mereka untuk "menandakan sebagai diselesaikan" tetapi beberapa halaman masih kembali sebagai 404.

Mereka hanya "diselesaikan" jika anda telah meletakkan semula halaman. Jika anda menandakan ia diselesaikan dan halaman itu tidak wujud maka kesilapan merangkak hanya akan berulang. Sekiranya halaman itu tidak wujud maka cuma tinggalkannya.

Genuine 404's tidak membahayakan kedudukan carian anda. Laporan 404 dalam GWT adalah untuk faedah anda supaya anda dapat melihat apabila keadaan menjadi salah apabila halaman tidak dapat dijumpai yang sepatutnya dijumpai!

Halaman-halaman yang tidak relevan dalam SERP ini mungkin merupakan gangguan kecil kepada pengguna anda, namun apa yang mereka cari untuk mencari lorem ipsum anda ?