Free Robots.txt Generator

Create a valid robots.txt file in seconds. Control search engine crawlers, block AI bots, set crawl rules, and download your file ready to upload.

Quick Presets

Search Engine Crawlers

AI Crawlers

2026

Control which AI bots can crawl your site for training data. Blocking these does NOT affect your search rankings.

Blocked Directories

Custom Paths

Advanced Settings

Seconds between requests. Only Bing and Yandex honor this. Google ignores it — use Search Console instead.

Generated robots.txt

29 active rules

# robots.txt generated by Kleap - 2026-05-31
# https://kleap.co/tools/robots-txt-generator

User-agent: *
Disallow: /admin/
Disallow: /api/
Disallow: /private/

# AI Crawlers
User-agent: GPTBot
Disallow: /

User-agent: ChatGPT-User
Disallow: /

User-agent: Google-Extended
Disallow: /

User-agent: Claude-Web
Disallow: /

User-agent: PerplexityBot
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: Bytespider
Disallow: /

User-agent: Amazonbot
Disallow: /

User-agent: FacebookBot
Disallow: /

User-agent: anthropic-ai
Disallow: /

User-agent: cohere-ai
Disallow: /

How to use this file

Upload this file to the root of your website so it is accessible at yoursite.com/robots.txt. Most hosting platforms (Vercel, Netlify, WordPress) have a public/ or root directory where you drop it. Changes take effect immediately — no restart required.

Apa itu File Robots.txt?

File robots.txt adalah file teks biasa yang ditempatkan di root website Anda (yoursite.com/robots.txt) yang memberi tahu web crawler — termasuk bot mesin pencari seperti Googlebot dan Bingbot — halaman mana yang boleh dan tidak boleh mereka indeks.

Pada 2026, robots.txt menjadi lebih penting dari sebelumnya. Di luar crawler mesin pencari tradisional, gelombang baru bot AI — GPTBot (OpenAI), ClaudeBot (Anthropic), Google-Extended — mengumpulkan konten untuk melatih model bahasa besar. Robots.txt adalah cara utama untuk mengontrol apakah konten Anda digunakan untuk pelatihan AI.

Why Use Our Robots.txt Generator?

One-Click Presets

Choose from 6 presets: Allow All, Block All, Standard, E-commerce, WordPress, and Block AI Bots. Start with a template and customize from there.

AI Bot Controls

Block or allow 11 AI crawlers including GPTBot, Claude-Web, PerplexityBot, CCBot, and Bytespider. Most generators in 2026 still do not cover these.

Live Validation

See warnings in real-time when you make risky choices, like blocking Googlebot or disallowing your entire site. Prevent costly SEO mistakes before they happen.

Search Engine Controls

Granular control over Googlebot, Bingbot, Slurp (Yahoo), DuckDuckBot, Baiduspider, and YandexBot. Allow or block each crawler individually.

Sitemap Declaration

Add your sitemap URL directly in robots.txt so crawlers discover all your pages. This is a best practice recommended by Google and Bing.

Copy & Download

Copy to clipboard or download as a .txt file. Upload to your site root and you are done. No signup, no account, no limitations.

Why You Need to Control AI Bots in 2026

Since 2024, AI companies have deployed web crawlers that scrape websites to train large language models. GPTBot (OpenAI), Claude-Web (Anthropic), PerplexityBot, CCBot (Common Crawl), Bytespider (ByteDance/TikTok), and others now crawl billions of pages. Unlike search engine crawlers that drive traffic to your site, AI crawlers take your content to train models — without sending visitors back.

Blocking AI bots in your robots.txt is the most effective way to prevent your content from being used for AI training. Major publishers like The New York Times, CNN, and Reuters have already added these blocks. The important distinction: blocking AI bots does NOT affect your Google or Bing rankings. Search engine crawlers and AI crawlers are separate user agents.

Our generator includes 11 known AI crawler user agents, updated for 2026. As new AI crawlers emerge, we add them. This is one of the few robots.txt generators that covers AI bots comprehensively — most competitors still only handle traditional search engine crawlers.

Cara Menyiapkan Robots.txt Anda

Menyiapkan robots.txt itu mudah. Berikut panduan langkah demi langkah untuk melakukannya dengan benar.

1. Buat File Anda

Gunakan generator di atas untuk mengkonfigurasi aturan Anda. Mulai dengan preset (Standard direkomendasikan untuk sebagian besar situs) dan sesuaikan sesuai kebutuhan.

2. Unggah ke Root Situs Anda

File harus berada di yoursite.com/robots.txt — bukan di subdirektori. Di sebagian besar platform: Vercel dan Next.js menggunakan folder public/. WordPress menggunakan direktori root. Untuk Kleap, file dihasilkan secara otomatis.

3. Uji Robots.txt Anda

Setelah mengunggah, kunjungi yoursite.com/robots.txt di browser untuk mengonfirmasi dapat diakses. Kemudian gunakan alat Robots.txt Tester Google Search Console untuk memvalidasi aturan Anda.

4. Monitor dan Perbarui

Tinjau robots.txt Anda setiap kuartal. Bot AI baru muncul secara teratur — tambahkan user agent mereka saat muncul. Jika Anda menambahkan bagian baru ke situs Anda, pastikan aturan yang ada masih benar.

Kleap vs Other Robots.txt Generators

FiturKleapSEOptimerSmallSEOTools
HargaFree, no limitsFree (basic)Free with ads
AI Bot Controls11 AI crawlers (GPTBot, Claude, etc.)Tidak adaTidak ada
Preset Templates6 presets (Standard, E-commerce, WordPress...)Basic onlyTidak ada
Live WarningsReal-time validation warningsBasic syntax checkNo validation
Download .txtCopy + DownloadCopy onlyCopy only
Tidak Perlu MendaftarYaYaYa

Orang Juga Bertanya

Apa yang terjadi jika saya tidak memiliki file robots.txt?+
Tanpa file robots.txt, semua crawler (mesin pencari dan bot AI) mengasumsikan mereka dapat mengakses setiap halaman di situs Anda. Ini bukan masalah untuk sebagian besar halaman, tetapi bisa bermasalah jika Anda memiliki halaman administratif, konten duplikat, atau ingin mencegah pelatihan AI pada konten Anda.
Apakah robots.txt memengaruhi peringkat SEO saya?+
Robots.txt sendiri tidak secara langsung memengaruhi peringkat. Namun, memblokir Googlebot akan menghapus halaman Anda dari hasil pencarian. Gunakan robots.txt untuk memblokir halaman yang tidak seharusnya diindeks, bukan sebagai alat pengoptimalan SEO.
Bisakah saya memblokir bot AI tanpa memengaruhi Google?+
Ya. Crawler AI (GPTBot, Claude-Web, PerplexityBot, CCBot, dll.) menggunakan user agent yang berbeda dari Googlebot. Memblokir mereka tidak memengaruhi pengindeksan Google sama sekali.
Apakah robots.txt dapat ditegakkan secara hukum?+
Robots.txt adalah standar sukarela — tidak ada mekanisme penegakan teknis. Namun, perusahaan AI besar (OpenAI, Anthropic, Google) telah berkomitmen untuk menghormatinya.
Seberapa sering saya harus memperbarui robots.txt saya?+
Tinjau setiap kuartal. Bot AI baru muncul secara teratur, dan struktur situs Anda mungkin berubah. Setelah desain ulang situs besar, periksa apakah aturan yang ada masih relevan.

Pertanyaan yang Sering Diajukan

Apa itu file robots.txt?+
File robots.txt adalah file teks biasa di root website Anda yang menginstruksikan web crawler (bot mesin pencari, bot AI, dan bot lainnya) halaman mana yang boleh dan tidak boleh mereka akses.
Di mana saya meletakkan file robots.txt?+
Harus berada di root domain Anda: yoursite.com/robots.txt. Di Next.js dan Vercel, tempatkan di folder public/. Di WordPress, ini biasanya dihasilkan secara otomatis.
Bisakah robots.txt memblokir semua crawler AI?+
Ya. Generator kami menyertakan 11 user agent crawler AI yang diketahui per 2026: GPTBot, ChatGPT-User, Google-Extended, Claude-Web, PerplexityBot, CCBot, anthropic-ai, cohere-ai, Bytespider, Omgilibot, dan FacebookBot.
Apakah memblokir Googlebot menghapus situs saya dari pencarian?+
Ya. Jika Anda memblokir Googlebot, Google akhirnya akan menghapus semua halaman Anda dari indeks pencariannya. Ini hampir tidak pernah diinginkan — berhati-hatilah saat mengkonfigurasi aturan untuk Googlebot.
Apa perbedaan antara Disallow dan noindex?+
Disallow di robots.txt mencegah crawler mengakses halaman. Tag meta noindex (atau header X-Robots-Tag) memberi tahu crawler untuk tidak mengindeks halaman (bahkan jika mereka mengaksesnya). Mereka adalah mekanisme yang berbeda dengan tujuan yang berbeda.
Haruskah saya menambahkan sitemap ke robots.txt?+
Ya, ini adalah praktik terbaik. Menambahkan direktif Sitemap: membantu crawler menemukan semua halaman Anda, terutama yang baru.
Apa itu crawl delay?+
Crawl-delay memberi tahu crawler untuk menunggu sejumlah detik tertentu antar permintaan. Ini mencegah kelebihan beban server dari crawler yang agresif.
Bisakah saya menggunakan wildcard di robots.txt?+
Ya. Googlebot dan Bingbot mendukung * (cocok dengan urutan apa pun) dan $ (akhir URL). Misalnya, Disallow: /*.pdf$ memblokir semua URL PDF.
Apakah generator robots.txt ini gratis?+
Sepenuhnya gratis, tanpa perlu akun dan tanpa batas penggunaan. Hasilkan file robots.txt sebanyak yang Anda butuhkan.
Bagaimana cara menguji apakah robots.txt saya berfungsi?+
Setelah mengunggah, kunjungi yoursite.com/robots.txt di browser Anda untuk mengonfirmasi file aktif. Kemudian gunakan alat Robots.txt Tester Google Search Console.

Build a Website with SEO Built In

Kleap generates robots.txt, sitemaps, meta tags, and structured data automatically. Focus on your content, not technical SEO configuration.

Mulai Membangun Gratis
Free Robots.txt Generator | Create & Validate Your Robots.txt 2026