Cara Guna Google Search Console untuk Kesalahan Crawling & Link Error

Cara Guna Google Search Console untuk Kesalahan Crawling & Link Error



Ramai blogger sangka bila artikel dah diterbitkan, tugas menulis pun selesai.

Padahal, artikel yang diterbitkan tak semestinya diindeks oleh Google.
Sebab utama? — kesalahan crawling dan link error.

Inilah sebab kenapa Google Search Console (GSC) sangat penting. Ia bukan sekadar tempat tengok “clicks” dan “impressions”, tapi juga alat diagnostik SEO paling berkuasa dan percuma dari Google sendiri.

Dalam artikel ini, aku akan kongsikan cara guna GSC untuk:
  • Kenal pasti kesalahan crawling,
  • Semak link error (404, 500, dsb.)
  • Faham maksud laporan “Page Indexing”
  • Dan cara betulkan supaya artikel cepat diindeks.

1. Apa Itu Crawling & Link Error?

Sebelum itu, korang kena faham dua istilah asas:

Crawling

Crawling ialah proses di mana Googlebot (robot Google) melawat laman korang untuk membaca kandungan, pautan, dan struktur laman. Sekiranya Googlebot gagal akses sesuatu halaman, itu dipanggil crawl error.

Link Error

Link error berlaku apabila pautan dalam blog:
  • menunjuk ke halaman yang kosong (404),
  • menghala ke halaman disekat (blocked by robots.txt),
  • atau terlalu lambat untuk dimuat (timeout).

Kesalahan-kesalahan ni buat Google susah nak faham struktur blog korang. Kesannya artikel sukar diindeks atau jatuh ranking.


2. Cara Akses Google Search Console

  • Pergi ke https://search.google.com/search-console/
  • Log masuk guna akaun Gmail yang sama dengan akaun blog.
  • Tambahkan blog dengan klik “Add Property”.
  • Pilih kaedah: 
    • Domain (DNS verification) – lebih menyeluruh, 
    • atau URL Prefix (HTML tag / file) – sesuai untuk Blogspot.
Untuk blogspot, biasanya GSC akan automatik sah sebab domainnya bawah akaun Google.

 

3. Bahagian Penting untuk Semak Crawling & Error

Dalam dashboard GSC, tiga bahagian utama yang wajib blogger tahu:

1. Indexing → Pages

Bahagian ini tunjuk berapa banyak halaman yang:
  • sudah diindeks,
  • belum diindeks,
  • dan sebab kenapa ia tidak diindeks.

Contoh mesej biasa yang muncul:
Indexed, not submitted in sitemap — Google jumpa sendiri.
⚠️ Crawled - currently not indexed — Google baca tapi belum masuk senarai indeks.
Discovered - currently not indexed — Google tahu kewujudan tapi belum semak.
🚫 Blocked by robots.txt — korang sekat sendiri.
404 Not Found — pautan hilang atau salah.
Klik setiap kategori untuk lihat URL yang terlibat.

Cara Guna Google Search Console untuk Kesalahan Crawling & Link Error

2. Experience →  Core Web Vitals

Bahagian ni bukan error crawling, tapi boleh beri kesan jika halaman terlalu perlahan atau tidak mesra peranti mudah alih (mobile friendly). Jika terlalu lambat dimuat, kadang-kadang Googlebot akan “give up” semasa crawling.


3. Crawl Stats (di bawah “Settings”)

Bahagian tersembunyi tapi sangat berguna.

Settings → Crawl Stats

Di sini korang boleh lihat:
  • Berapa kali sehari Googlebot lawat blog korang.
  • Berapa banyak halaman di-crawl.
  • Error yang berlaku (timeout, server error, DNS error).
Jika graf “Crawl requests” turun mendadak, itu tanda Google mula sukar akses blog korang.

Cara Guna Google Search Console untuk Kesalahan Crawling & Link Error



 

4. Cara Kenal Pasti dan Betulkan Kesalahan Crawling

Berikut beberapa jenis kesalahan biasa dan cara baikinya:

Jenis Error Punca Utama Cara Betulkan
404 Not Found Halaman dipadam atau pautan rosak Buat redirect 301 ke halaman baru atau hapus pautan itu
Server Error (5xx) Masalah hosting / server overload Hubungi penyedia hosting, pastikan uptime stabil
Blocked by robots.txt Korang sekat crawler secara tak sengaja Semak fail /robots.txt
Crawled - Not Indexed Kandungan nipis / duplikasi Tambah isi, ubah struktur, dan minta reindex
Redirect Error Rantaian redirect terlalu panjang Pastikan hanya 1 langkah redirect (contoh: A → B sahaja)


5. Cara Praktikal Guna GSC untuk Betulkan Masalah

Langkah 1: Buka Laporan “Page Indexing”

  • Pergi ke menu Indexing → Pages, lihat bahagian “Not Indexed”.
  • Klik pada salah satu sebab, contohnya: “Crawled – currently not indexed”
  • Di bawahnya, GSC akan senaraikan URL yang terlibat.


Langkah 2: Klik Satu URL → Tekan ‘Inspect URL’

Korang akan lihat status semasa: sama ada halaman diindeks, bila terakhir kali di-crawl, dan sama ada ada sekatan (robots.txt / noindex tag).
 

Cara Guna Google Search Console untuk Kesalahan Crawling & Link Error

Cara Guna Google Search Console untuk Kesalahan Crawling & Link Error

Maksud keseluruhan laporan

Google jumpa halaman tersebut, crawl (lawat) dengan berjaya, dan halaman dibenarkan untuk diindeks — tetapi Google memilih untuk TIDAK mengindeksnya buat masa ini.

Maksudnya:
  • Googlebot sudah melawat URL itu.
  • Tiada masalah teknikal.
  • Tiada halangan seperti noindex atau robots.txt.
Tapi Google rasa halaman itu tidak cukup penting atau relevan untuk dimasukkan ke dalam carian.


Ini biasa berlaku untuk:
  • Halaman komen (comment feed)
  • Halaman yang nipis atau kurang kandungan
  • Halaman yang hampir sama dengan halaman lain (duplicate)
  • Halaman bukan kandungan utama blog

No referring sitemaps : URL ini tidak ada dalam sitemap.
  • Tak ada masalah — Google jumpa melalui link lain.


Referring page : Google jumpa URL ini daripada:
  • Atom feed blog
  • Link komen dalam satu posting
Ini menunjukkan halaman ini ialah halaman komen, bukan artikel.


Crawl allowed & Successful : Google boleh akses dan berjaya memuat halaman itu.

Indexing allowed? Yes
  • Halaman ini tidak diblock, Tetapi Google tetap pilih untuk tidak indeks.

Canonical
  • Tiada canonical, tetapi itu tidak masalah.
  • Google cuma tidak anggap halaman ini penting untuk carian.


Kenapa Google tidak indeks halaman ini?

Kerana URL ini ialah comment feed seperti:

/feeds/.../comments/default


Google biasanya TIDAK mengindeks:
  • Comment feed
  • Atom feed
  • RSS feed
  • Halaman auto-generated
  • Halaman bukan kandungan utama

Tiada apa yang perlu diperbaiki. Ini bukannya isu atau masalah SEO.


Langkah 3: Tekan “Test Live URL”

Google akan semak terus sama ada halaman boleh diakses sekarang. Jika berjaya, korang akan nampak:
“URL is available to Google.”

Kalau gagal, ia akan tunjuk mesej error seperti “Page not reachable” atau “Redirect error”.

Cara Guna Google Search Console untuk Kesalahan Crawling & Link Error

Langkah 4: Tekan “Request Indexing”

Lepas pastikan semua okay (artikel wujud, tak disekat, tiada error server), tekan butang Request Indexing.

Google akan masukkan semula halaman tu dalam barisan untuk diindeks semula.


 

6. Semak Link Error Secara Menyeluruh

Selain “Page Indexing”, korang juga boleh kesan broken link. Dalam bahagian “Not Indexed”, cari yang bertanda:

❌ “Not found (404)”

Klik →  Korang akan nampak senarai semua pautan rosak. Ini termasuk:
  • Artikel lama yang dipadam,
  • Pautan internal yang tersalah taip,
  • Atau URL yang ubah tapi tak redirect.
💡 Tip: Gunakan tool tambahan seperti Broken Link Checker dan Inspect Link Satu per Satu


Untuk setiap 404, klik → pilih “Inspect URL” → lihat “Referring Page”.

Bahagian ni tunjuk halaman mana dalam blog yang memaut ke pautan rosak tu. Edit artikel tersebut dan buang pautan atau ganti dengan URL baru.
 

7. Cara Elak Kesalahan Crawling di Masa Hadapan

Pastikan struktur internal link kemas.
– Gunakan link relevan dan pastikan tiada pautan mati.


Gunakan sitemap.xml.
– Pastikan semua artikel aktif disenaraikan dalam sitemap dan dihantar di GSC.


Elak duplikasi URL.
– Jangan guna dua URL untuk artikel sama (contoh versi www dan non-www).


Pastikan blog mudah diakses.
– Hosting laju, mobile-friendly, dan tiada halangan JavaScript berat.


Pantau laporan GSC sekurang-kurangnya seminggu sekali.
– Google update laporan crawling hampir setiap hari.


8. Bonus: Gunakan “Crawl Stats” Sebagai Penunjuk Kesihatan Blog

Pergi ke Settings Crawl Stats, dan semak 3 perkara penting:
  • Total crawl requests – lebih tinggi = Google kerap lawat blog.
  • Average response time – pastikan bawah 500ms.
  • Failed requests – kalau tinggi, ada masalah pada hosting atau server.

Jika nilai “Failed Requests” kerap naik, itu tanda Googlebot susah baca blog korang — dan perlu disemak segera.
 

Rumusan: GSC Sebagai Doktor Blog Korang

Google Search Console bukan sekadar laporan klik dan keyword — ia sebenarnya doktor kesihatan blog.

Setiap kali Google gagal “baca” blog korang, satu peluang ranking hilang. Jadi jadikan Google Search Console bukan sekadar alat, tapi teman harian dalam strategi SEO.

Luangkan 10 minit seminggu untuk semak laporan GSC. Itu sudah cukup untuk elak kesalahan teknikal yang perlahan-lahan menurunkan prestasi blog.

Kerana dalam SEO, bukan siapa yang menulis paling banyak — tapi siapa yang paling faham apa yang Google nampak.

0 Ulasan

Catat Ulasan

Post a Comment (0)

Terbaru Lebih lama
Belajar Buat Blog | Panduan BlogTitle of a News Article Belajar Buat Blog | Panduan Blog Belajar Buat Blog | Panduan Blog