Cara Mengenalpasti Kandungan Berkualiti Rendah, Nipis, Bertulis AI secara Pukal Menggunakan Screaming Frog dan OpenAI

in Sumber & Peralatan

Kualiti kandungan adalah faktor penting dalam kedudukan enjin carian dan penglibatan pengguna. Mengenal pasti halaman dengan kandungan berkualiti rendah atau nipis boleh membantu anda meningkatkan nilai tapak web anda, meningkatkan SEO dan memberikan pengalaman yang lebih baik untuk pelawat anda. Dalam panduan ini, saya akan tunjukkan kepada anda cara menggunakan ciri JavaScript Tersuai Screaming Frog dan API OpenAI untuk menilai kualiti kandungan anda secara automatik.

Mengaudit kandungan tapak web secara manual untuk isu kualiti adalah tugas yang menakutkan dan memakan masa. Menyaring setiap halaman untuk menilai keaslian, kaitan dan nilai boleh menjadi sangat menggembirakan, terutamanya untuk tapak web besar dengan ratusan atau ribuan halaman.

Cabaran semakin sengit apabila cuba mengesan kandungan yang dijana AI, yang boleh menjejaskan keunikan dan keaslian tapak anda. Titik kesakitan ini menyerlahkan keperluan untuk penyelesaian automatik yang cekap mengenal pasti kandungan berkualiti rendah, nipis atau bertulis AI, membolehkan anda menumpukan usaha anda untuk meningkatkan kualiti keseluruhan tapak web anda.

Panduan ini akan menunjukkan kepada anda cara menggunakan Ciri JavaScript Tersuai Screaming Frog dan API OpenAI untuk mengautomasikan proses ini, menjimatkan masa anda dan memberi anda audit kandungan komprehensif yang boleh anda lakukan dengan mudah.

Apa yang anda perlukan:

  • Menjerit Frog SEO Spider: Versi 19.0 atau lebih baru.
  • Kunci API OpenAI: Akses kepada model OpenAI GPT-4 atau GPT-3.5-turbo melalui API.
  • Microsoft Excel: Untuk analisis data.

Nota: Anda mesti mempunyai kunci API OpenAI yang aktif. Daftar di laman web OpenAI jika anda tidak mempunyai satu.

Gambaran Keseluruhan Proses

  1. Konfigurasikan Katak Menjerit: Sediakan Screaming Frog untuk memaparkan JavaScript dan menggunakan coretan kod JavaScript tersuai.
  2. Gunakan API OpenAI: JavaScript tersuai menghantar kandungan halaman ke API OpenAI, yang menilai kualiti kandungan.
  3. Rangka Laman Web Anda: Screaming Frog merangkak URL yang ditentukan, mengumpul skor kualiti dan penilaian.
  4. Menganalisis Data: Eksport data rangkak ke Excel, ekstrak markah dan kenal pasti halaman yang memerlukan penambahbaikan.

Panduan Langkah demi Langkah

1. Mula Menjerit Frog SEO Spider

Lancarkan aplikasi Screaming Frog SEO Spider pada komputer anda.

2. Dayakan Rendering JavaScript

Untuk memaparkan kandungan dinamik dan melaksanakan skrip kami dengan tepat:

  • Pergi ke konfigurasi > Labah-labah.
  • Klik pada Memberi tab.
  • pilih JavaScript daripada pilihan rendering.
  • Klik OK.
Dayakan ScreamingFrog Rendering JavaScript

3. Konfigurasikan JavaScript Tersuai

Sediakan coretan JavaScript tersuai yang berkomunikasi dengan API OpenAI:

  • Pergi ke konfigurasi > Adat > JavaScript.
  • Klik pada Tambah untuk membuat coretan baharu.
  • Klik ikon JS untuk membuka editor kod JavaScript.
Editor JavaScript Tersuai Screaming Frog

Masukkan Kod JavaScript Tersuai

Salin dan tampal kod berikut ke dalam editor skrip:

// Ask ChatGPT about AI detection
//
// Adjust the value of 'question' on line 26.
// Adjust the value of 'userContentList' on line 27, currently set to body text.
// Other examples such as page title, meta description, heading h1 or h2 are
// shown on line 32 onwards.
//    
// 
// This script demonstrates how JavaScript Snippets can communicate with 
// APIs, in this case ChatGPT.
// 
// This script also shows how the Spider will wait for JavaScript Promises to
// be fulfilled i.e. the fetch request to the ChatGPT API when fulfilled
// will return the data to the Spider.
// 
// IMPORTANT:
// You will need to supply your API key below on line 25 which will be stored
// as part of your SEO Spider configuration in plain text. Also be mindful if 
// sharing this script that you will be sharing your API key also unless you 
// delete it before sharing.
// 
// Also be aware of API limits when crawling large web sites with this snippet.
//

const OPENAI_API_KEY = 'YOUR_OPENAI_API_KEY';
const question = `**The Score is: %%**\n\n
You are an expert in detecting low-quality, thin, and unhelpful content. Start your response with **The Score is: %%** followed by your analysis.\n\n
**Assessment:**\n\n
Consider the following criteria, citing specific examples from the text to support your analysis:\n\n
- **Lack of Originality:** Does the content provide unique insights, personal experiences, or well-researched perspectives, or is it simply rehashing common knowledge?\n\n
- **Unnatural Phrasing:** Does the language sound robotic, awkward, or overly formal? Does it lack a natural flow or smooth transitions?\n\n
- **Purpose:** Is the content informative, engaging, and relevant for its intended audience and purpose?\n\n
- **Value:** Does the text go beyond surface-level observations to offer meaningful information, insights, or analysis?\n\n
- **Supporting Evidence:** Are claims supported by credible examples, data, research, or citations? Are the examples relevant and well-explained?\n\n
- **Tone:** Is the tone engaging and appropriate for the intended audience? Does it make the text enjoyable to read?\n\n
**Reasoning:**\n\n
Provide a concise explanation of the reasoning behind your assessment and score.\n\n
**Score:**\n\n
After your analysis, assign a probability score (0-100%) indicating how likely the content is to be low-quality, thin, or unhelpful:\n\n
- **0-20%:** Very unlikely to be low-quality. The text is well-written, informative, and engaging, showing strong signs of quality.\n\n
- **21-40%:** Unlikely to be low-quality, though there may be room for improvement.\n\n
- **41-60%:** Possibly low-quality, but further analysis may be required.\n\n
- **61-80%:** Likely low-quality, with multiple signs of thinness or lack of helpfulness.\n\n
- **81-100%:** Very likely low-quality due to numerous factors indicating poor content.`;
const userContentList = [document.body.innerText];

// Page Title
// const userContentList = [document.title];

// meta description
// const userContentList = [document.querySelector('meta[name="description"]')?.getAttribute('content')];

// heading h1 (replace with h2 etc as required)
// const userContentList = [...document.querySelectorAll('h1')].map(h => h.textContent);

function chatGptRequest(userContent) {
    return fetch('https://api.openai.com/v1/chat/completions', {
        method: 'POST',
        headers: {
            'Authorization': `Bearer ${OPENAI_API_KEY}`,
            "Content-Type": "application/json",
        },
        body: JSON.stringify({
            "model": "gpt-4o",
            "messages": [
                {
                    role: "user",
                    content: `${question} ${userContent}`
                }
            ],
            "temperature": 0.7
        })
    })
    .then(response => {
        if (!response.ok) {
            return response.text().then(text => {throw new Error(text)});
        }                
        return response.json();
    })
    .then(data => {
        return data.choices[0].message.content.trim();
    });
}

return Promise.all(userContentList.map(userContent => {
    return chatGptRequest(userContent);
}))
.then(data => seoSpider.data(data))
.catch(error => seoSpider.error(error));

penting: Gantikan 'KUNCI_API_OPENAI ANDA' dengan kunci API OpenAI sebenar anda. Pastikan kunci API anda selamat dan jangan kongsikannya secara terbuka.

Simpan Skrip

  • Berikan skrip anda nama yang boleh dikenali, seperti “Penilaian Kualiti Kandungan”.
  • Klik OK untuk menyimpan skrip.

4. Import URL ke Audit

Anda boleh sama ada merangkak keseluruhan tapak web anda atau mengimport senarai URL tertentu (yang terakhir disyorkan).

Untuk Mengimport URL:

  • Pergi ke mod > senarai.
  • Klik pada Upload > Inti.
  • Tampalkan senarai URL anda ke dalam kotak dialog.
  • Klik OK.

5. Mulakan Crawl

  • Klik Start butang untuk mula merangkak.
  • Screaming Frog akan merangkak setiap URL, menjalankan JavaScript tersuai dan mengumpul data.
  • Pergi ke tab JavaScript Tersuai untuk menyemak kemajuan rangkak.
skor kandungan openai

6. Eksport dan Analisis Hasilnya

Eksport Data

  • Setelah merangkak selesai, pergi ke Eksport .
  • Simpan eksport sebagai fail Excel atau CSV.

Buka dalam Excel

  • Buka fail dalam Microsoft Excel.
  • Anda akan melihat URL bersama-sama dengan data yang dikembalikan daripada JavaScript tersuai (iaitu, penilaian kandungan).

Memahami Coretan JavaScript Tersuai

Coretan JavaScript tersuai melakukan tindakan berikut:

  1. Mentakrifkan Prompt: Membuat gesaan terperinci yang mengarahkan AI untuk menilai kualiti kandungan berdasarkan beberapa kriteria.
  2. Mengekstrak Kandungan Halaman: Mendapatkan semula teks dalam daripada badan halaman (document.body.innerText).
    • Pilihan: Anda boleh menyesuaikan diri userContentList untuk menyasarkan elemen tertentu, seperti tajuk atau perihalan meta.
  3. Memanggil API OpenAI: Menghantar permintaan kepada OpenAI API dengan gesaan dan kandungan halaman.
  4. Memproses Respons: Menerima dan mengembalikan penilaian AI, yang merangkumi skor dan penaakulan.

Pembolehubah Utama Diterangkan

  • OPENAI_API_KEY: Kunci API OpenAI anda untuk pengesahan.
  • question: Gesaan yang diberikan kepada AI.
  • userContentList: Tatasusunan yang mengandungi kandungan yang akan dianalisis.

Nota tentang Model

  • Skrip menggunakan parameter "model": "gpt-4".
  • Jika anda tidak mempunyai akses kepada GPT-4, anda boleh menukar ini kepada “model”: “gpt-4o”, “model”: “gpt-4o-mini” atau “model”: “gpt-3.5-turbo” .

Menggunakan Excel untuk Mengekstrak Skor

Maklum balas AI bermula dengan “Skornya ialah: XX%”, Di mana XX ialah skor berangka.

Untuk mengekstrak skor ini untuk pengisihan dan penapisan:

  1. Buka merangkak dalam Excel atau CSV.
  2. Sisipkan Lajur Baharu: Di sebelah lajur yang mengandungi respons AI.
  3. Gunakan Formula Excel Tersuai:
=VALUE(MID(A2,FIND(":",A2)+2,FIND("%",A2)-FIND(":",A2)-2)/100)
  • Ganti A2 dengan rujukan sel yang mengandungi tindak balas AI.
  1. Seret Formula: Gunakannya pada semua baris yang mengandungi data.
Screaming Frog OpenAI skor kandungan dalam Excel

Bagaimana Formula Berfungsi

  • FIND(":", A2)+2: Mencari kedudukan selepas kolon dan ruang.
  • FIND("%", A2): Mencari kedudukan simbol peratusan.
  • MID(...): Mengeluarkan subrentetan yang mengandungi skor.
  • VALUE(...): Menukar teks yang diekstrak kepada nilai berangka.

Contoh

Jika tindak balas AI dalam sel A2 ialah:

The Score is: 75%

**Assessment:**

... (assessment text)

Formula akan diekstrak 0.75 sebagai nombor.

Wrap Up

Dengan menyepadukan Screaming Frog dengan model bahasa OpenAI, anda boleh mengautomasikan proses mengaudit kandungan tapak web anda untuk isu kualiti. Kaedah ini membolehkan anda mengenal pasti dengan cepat halaman yang mungkin memerlukan penambahbaikan, memastikan tapak anda mengekalkan standard yang tinggi untuk kedua-dua pengguna dan enjin carian.

Pernahkah anda mencuba menggunakan skrip ini untuk mengaudit kandungan tapak web anda? Saya ingin mendengar tentang pengalaman anda. Adakah anda menyesuaikan skrip untuk memenuhi keperluan khusus anda atau menumpukan pada elemen kandungan tertentu? Kongsi pandangan anda dan beritahu kami cara pendekatan ini telah membantu anda meningkatkan kualiti tapak anda.

Ingat untuk menggunakan alat berkuasa ini secara bertanggungjawab, dengan mengambil kira had penggunaan API dan kebimbangan privasi. Mengaudit kandungan anda secara kerap boleh membawa kepada prestasi SEO yang lebih baik, peningkatan penglibatan pengguna dan kehadiran dalam talian yang lebih kukuh.

Soalan Lazim

1. Adakah selamat untuk berkongsi kunci API OpenAI saya dalam skrip?

Tidak, kunci API anda ialah maklumat sensitif. Jangan sekali-kali berkongsi kunci API anda secara terbuka atau masukkannya dalam skrip yang mungkin diakses oleh orang lain. Sentiasa pastikan ia selamat.

2. Bagaimana jika saya tidak mempunyai akses kepada GPT-4?

Anda boleh mengubah suai skrip untuk menggunakan GPT-4o, GPT-4o-mini atau GPT-3.5-turbo dengan menukar parameter model:

"model": "gpt-4o-mini",

3. Adakah terdapat kos yang berkaitan dengan penggunaan API OpenAI?

Ya, menggunakan OpenAI API menanggung kos berdasarkan penggunaan. Untuk menjimatkan kos, hadkan bilangan URL yang anda putuskan untuk merangkak. Rujuk kepada Halaman harga OpenAI untuk maklumat lanjut.

4. Bagaimanakah saya boleh menyesuaikan kriteria yang digunakan dalam penilaian?

Anda boleh mengubah suai soalan pembolehubah dalam skrip (soalan const = 'xxx') untuk memasukkan atau mengecualikan kriteria berdasarkan keperluan khusus anda.

5. Bolehkah saya menggunakan kaedah ini untuk menganalisis kandungan bukan bahasa Inggeris?

Ya, model OpenAI menyokong berbilang bahasa. Walau bagaimanapun, keberkesanan mungkin berbeza-beza berdasarkan bahasa dan model yang digunakan.

6. Apakah had kadar IPU?

Had kadar API bergantung pada akaun OpenAI anda dan model yang digunakan. Semak Garis panduan had kadar OpenAI untuk maklumat lanjut.

mengenai Penulis

Matt Ahlgren

Mathias Ahlgren ialah Ketua Pegawai Eksekutif dan pengasas Website Rating, mengemudi pasukan editor dan penulis global. Beliau memegang ijazah sarjana dalam sains maklumat dan pengurusan. Kerjayanya beralih kepada SEO selepas pengalaman awal pembangunan web semasa universiti. Dengan lebih 15 tahun dalam SEO, pemasaran digital dan pembangun web. Fokusnya juga termasuk keselamatan laman web, dibuktikan dengan sijil dalam Keselamatan Siber. Kepakaran yang pelbagai ini menyokong kepimpinan beliau di Website Rating.

Laman Utama » Sumber & Peralatan » Cara Mengenalpasti Kandungan Berkualiti Rendah, Nipis, Bertulis AI secara Pukal Menggunakan Screaming Frog dan OpenAI
Kongsi ke...