09.09.2024, 14:53
(Dieser Beitrag wurde zuletzt bearbeitet: 09.09.2024, 16:33 von Manfred Aabye.)
Dies blockiert alle aufgeführten Bots und das Crawlen deines OpenSim Servers.
Erstelle einfach zwei Textdateien namens robots.txt und .htaccess in deinem Web Bereich und füge dann den folgenden Inhalt ein:
Liste von robots.txt Einträgen für Blockierungen:
.htaccess zum Blockieren von gängigen Bots:
Hier ist eine Liste gängiger Bots, die häufig Webseiten crawlen.
Diese Liste enthält sowohl nützliche Suchmaschinen-Crawler als auch einige Bots von SEO-Tools und anderen Diensten.
Gängige Suchmaschinen-Bots:
Googlebot – Wird von Google verwendet, um Websites für den Google-Suchindex zu durchsuchen.
Bingbot – Der Crawler von Microsoft Bing.
Slurp – Der Bot der Yahoo-Suchmaschine.
DuckDuckBot – Der Crawler von DuckDuckGo.
BaiduSpider – Der Crawler der chinesischen Suchmaschine Baidu.
YandexBot – Wird von der russischen Suchmaschine Yandex verwendet.
Sogou Spider – Der Crawler der chinesischen Suchmaschine Sogou.
SEO- und Marketing-Bots:
AhrefsBot – Wird von Ahrefs für Backlink- und SEO-Daten verwendet.
DotBot – Verwendet von Moz (Open Site Explorer) zur Analyse von Webseiten.
SemrushBot – Verwendet von Semrush zur Analyse von SEO-Daten.
Majestic-12 Bot – Wird von Majestic für die Analyse von Backlink-Daten verwendet.
Screaming Frog SEO Spider – Ein Desktop-SEO-Tool zum Crawlen von Webseiten.
Social Media-Bots:
Twitterbot – Verwendet von Twitter, um Inhalte zu indexieren, die auf Twitter geteilt werden.
facebookexternalhit – Wird von Facebook verwendet, um Inhalte zu crawlen, die auf Facebook geteilt werden.
LinkedInBot – Wird von LinkedIn verwendet, um Inhalte zu durchsuchen, die auf LinkedIn geteilt werden.
Weitere nützliche Bots:
Applebot – Der Crawler, den Apple für Siri und Spotlight verwendet.
Pinterestbot – Wird von Pinterest verwendet, um Inhalte für die Plattform zu indexieren.
WhatsApp – Verwendet von WhatsApp für das Preloading von Links, die in Nachrichten geteilt werden.
Weitere gängige Crawler:
MJ12bot – Ein Crawler von Majestic für das Erstellen eines Backlink-Indexes.
PetalBot – Der Crawler der Huawei-Suchmaschine Petal Search.
Exabot – Ein französischer Suchmaschinen-Bot, der von Exalead betrieben wird.
UptimeRobot – Verwendet zur Überwachung der Verfügbarkeit von Websites.
Nachdem Blockieren sollte euer Server wieder schneller laufen.
Erstelle einfach zwei Textdateien namens robots.txt und .htaccess in deinem Web Bereich und füge dann den folgenden Inhalt ein:
Liste von robots.txt Einträgen für Blockierungen:
Code:
User-agent: Googlebot
Disallow: /
User-agent: Bingbot
Disallow: /
User-agent: AhrefsBot
Disallow: /
User-agent: DotBot
Disallow: /
User-agent: SemrushBot
Disallow: /
User-agent: Majestic-12
Disallow: /
User-agent: Screaming Frog SEO Spider
Disallow: /
User-agent: BaiduSpider
Disallow: /
User-agent: YandexBot
Disallow: /
User-agent: Sogou
Disallow: /
User-agent: MJ12bot
Disallow: /
User-agent: PetalBot
Disallow: /
.htaccess zum Blockieren von gängigen Bots:
Code:
<IfModule mod_rewrite.c>
RewriteEngine On
# Block Googlebot
RewriteCond %{HTTP_USER_AGENT} Googlebot [NC,OR]
# Block Bingbot
RewriteCond %{HTTP_USER_AGENT} Bingbot [NC,OR]
# Block AhrefsBot
RewriteCond %{HTTP_USER_AGENT} AhrefsBot [NC,OR]
# Block DotBot
RewriteCond %{HTTP_USER_AGENT} DotBot [NC,OR]
# Block SemrushBot
RewriteCond %{HTTP_USER_AGENT} SemrushBot [NC,OR]
# Block Majestic-12 Bot
RewriteCond %{HTTP_USER_AGENT} MJ12bot [NC,OR]
# Block Screaming Frog SEO Spider
RewriteCond %{HTTP_USER_AGENT} Screaming Frog SEO Spider [NC,OR]
# Block BaiduSpider
RewriteCond %{HTTP_USER_AGENT} BaiduSpider [NC,OR]
# Block YandexBot
RewriteCond %{HTTP_USER_AGENT} YandexBot [NC,OR]
# Block Sogou Spider
RewriteCond %{HTTP_USER_AGENT} Sogou [NC,OR]
# Block MJ12bot (Majestic)
RewriteCond %{HTTP_USER_AGENT} MJ12bot [NC,OR]
# Block PetalBot (Huawei)
RewriteCond %{HTTP_USER_AGENT} PetalBot [NC]
# Deny access for these bots
RewriteRule .* - [F,L]
</IfModule>
Hier ist eine Liste gängiger Bots, die häufig Webseiten crawlen.
Diese Liste enthält sowohl nützliche Suchmaschinen-Crawler als auch einige Bots von SEO-Tools und anderen Diensten.
Gängige Suchmaschinen-Bots:
Googlebot – Wird von Google verwendet, um Websites für den Google-Suchindex zu durchsuchen.
Bingbot – Der Crawler von Microsoft Bing.
Slurp – Der Bot der Yahoo-Suchmaschine.
DuckDuckBot – Der Crawler von DuckDuckGo.
BaiduSpider – Der Crawler der chinesischen Suchmaschine Baidu.
YandexBot – Wird von der russischen Suchmaschine Yandex verwendet.
Sogou Spider – Der Crawler der chinesischen Suchmaschine Sogou.
SEO- und Marketing-Bots:
AhrefsBot – Wird von Ahrefs für Backlink- und SEO-Daten verwendet.
DotBot – Verwendet von Moz (Open Site Explorer) zur Analyse von Webseiten.
SemrushBot – Verwendet von Semrush zur Analyse von SEO-Daten.
Majestic-12 Bot – Wird von Majestic für die Analyse von Backlink-Daten verwendet.
Screaming Frog SEO Spider – Ein Desktop-SEO-Tool zum Crawlen von Webseiten.
Social Media-Bots:
Twitterbot – Verwendet von Twitter, um Inhalte zu indexieren, die auf Twitter geteilt werden.
facebookexternalhit – Wird von Facebook verwendet, um Inhalte zu crawlen, die auf Facebook geteilt werden.
LinkedInBot – Wird von LinkedIn verwendet, um Inhalte zu durchsuchen, die auf LinkedIn geteilt werden.
Weitere nützliche Bots:
Applebot – Der Crawler, den Apple für Siri und Spotlight verwendet.
Pinterestbot – Wird von Pinterest verwendet, um Inhalte für die Plattform zu indexieren.
WhatsApp – Verwendet von WhatsApp für das Preloading von Links, die in Nachrichten geteilt werden.
Weitere gängige Crawler:
MJ12bot – Ein Crawler von Majestic für das Erstellen eines Backlink-Indexes.
PetalBot – Der Crawler der Huawei-Suchmaschine Petal Search.
Exabot – Ein französischer Suchmaschinen-Bot, der von Exalead betrieben wird.
UptimeRobot – Verwendet zur Überwachung der Verfügbarkeit von Websites.
Nachdem Blockieren sollte euer Server wieder schneller laufen.
Ein Metaversum sind viele kleine Räume, die nahtlos aneinander passen,
sowie direkt sichtbar und begehbar sind, als wäre es aus einem Guss.
sowie direkt sichtbar und begehbar sind, als wäre es aus einem Guss.