Results 1 to 13 of 13

Diese Unmengen an Crawlern auf der Site

This is a discussion on Diese Unmengen an Crawlern auf der Site within the Deutsch forums, part of the General Discussion category; Wenn man zu mir auf's Portal kommt, könnte man meinen da ist die Hölle los. 80% Prozent sind aber seit ...

  1. #1
    Member
    Real Name
    Stefan Eling
    Join Date
    Mar 2006
    Location
    munster, germany
    Posts
    30
    Liked
    1 times

    Diese Unmengen an Crawlern auf der Site

    Wenn man zu mir auf's Portal kommt, könnte man meinen da ist die Hölle los. 80% Prozent sind aber seit Tagen die Yahoo-Crawler.

    Anfangs ist das ja noch ok, die Leute kommen halt gerne gut besuchte Portale. Aber andererseits...

    Was also tun? Aussperren oder nicht anzeigen lassen? Wie macht Ihr das?

  2. #2
    Senior Member
    Real Name
    Mario
    Join Date
    Oct 2006
    Posts
    237
    Liked
    0 times
    per robots.txt aussperren

    nur ein Auszug
    User-agent: grub-client
    Disallow: /
    User-agent: grub
    Disallow: /
    User-agent: looksmart
    Disallow: /
    User-agent: WebZip
    Disallow: /
    User-agent: larbin
    Disallow: /
    User-agent: b2w/0.1
    Disallow: /
    User-agent: psbot
    Disallow: /
    User-agent: Python-urllib
    Disallow: /
    User-agent: NetMechanic
    Disallow: /
    User-agent: URL_Spider_Pro
    Disallow: /
    User-agent: CherryPicker
    Disallow: /
    User-agent: EmailCollector
    Disallow: /
    User-agent: EmailSiphon
    Disallow: /
    User-agent: WebBandit
    Disallow: /
    User-agent: EmailWolf
    Disallow: /
    User-agent: ExtractorPro
    Disallow: /
    User-agent: CopyRightCheck
    Disallow: /
    User-agent: Crescent
    Disallow: /
    User-agent: SiteSnagger
    Disallow: /
    User-agent: ProWebWalker
    Disallow: /
    User-agent: CheeseBot
    Disallow: /
    User-agent: LNSpiderguy
    Disallow: /
    User-agent: ia_archiver
    Disallow: /
    User-agent: ia_archiver/1.6
    Disallow: /
    User-agent: Teleport
    Disallow: /
    User-agent: TeleportPro
    Disallow: /
    User-agent: MIIxpc
    Disallow: /
    User-agent: Telesoft
    Disallow: /
    User-agent: Website Quester
    Disallow: /
    User-agent: moget/2.1
    Disallow: /
    User-agent: WebZip/4.0
    Disallow: /
    User-agent: WebStripper
    Disallow: /
    User-agent: WebSauger
    Disallow: /
    User-agent: WebCopier
    Disallow: /
    User-agent: NetAnts
    Disallow: /
    User-agent: Mister PiX
    Disallow: /
    User-agent: WebAuto
    Disallow: /
    User-agent: TheNomad
    Disallow: /
    User-agent: WWW-Collector-E
    Disallow: /
    User-agent: RMA
    Disallow: /
    User-agent: libWeb/clsHTTP
    Disallow: /
    User-agent: asterias
    Disallow: /
    User-agent: httplib
    Disallow: /
    User-agent: turingos
    Disallow: /
    User-agent: spanner
    Disallow: /
    User-agent: InfoNaviRobot
    Disallow: /
    User-agent: Harvest/1.5
    Disallow: /
    User-agent: Bullseye/1.0
    Disallow: /
    User-agent: Mozilla/4.0 (compatible; BullsEye; Windows 95)
    Disallow: /
    User-agent: Crescent Internet ToolPak HTTP OLE Control v.1.0
    Disallow: /
    User-agent: CherryPickerSE/1.0
    Disallow: /
    User-agent: CherryPickerElite/1.0
    Disallow: /
    User-agent: WebBandit/3.50
    Disallow: /
    User-agent: NICErsPRO
    Disallow: /
    User-agent: Microsoft URL Control - 5.01.4511
    Disallow: /
    User-agent: DittoSpyder
    Disallow: /
    User-agent: Foobot
    Disallow: /
    User-agent: WebmasterWorldForumBot
    Disallow: /
    User-agent: SpankBot
    Disallow: /
    User-agent: BotALot
    Disallow: /
    User-agent: lwp-trivial/1.34
    Disallow: /
    User-agent: lwp-trivial
    Disallow: /
    User-agent: BunnySlippers
    Disallow: /
    User-agent: Microsoft URL Control - 6.00.8169
    Disallow: /
    User-agent: URLy Warning
    Disallow: /
    User-agent: Wget/1.6
    Disallow: /
    User-agent: Wget/1.5.3
    Disallow: /
    User-agent: Wget
    Disallow: /
    User-agent: LinkWalker
    Disallow: /
    User-agent: cosmos
    Disallow: /
    User-agent: moget
    Disallow: /
    User-agent: hloader
    Disallow: /
    User-agent: humanlinks
    Disallow: /
    User-agent: LinkextractorPro
    Disallow: /
    User-agent: Offline Explorer
    Disallow: /
    User-agent: Mata Hari
    Disallow: /
    User-agent: LexiBot
    Disallow: /
    User-agent: Web Image Collector
    Disallow: /
    User-agent: The Intraformant
    Disallow: /
    User-agent: True_Robot/1.0
    Disallow: /
    User-agent: True_Robot
    Disallow: /
    User-agent: BlowFish/1.0
    Disallow: /
    User-agent: JennyBot
    Disallow: /
    User-agent: MIIxpc/4.2
    Disallow: /
    User-agent: BuiltBotTough
    Disallow: /
    User-agent: ProPowerBot/2.14
    Disallow: /
    User-agent: BackDoorBot/1.0
    Disallow: /
    User-agent: toCrawl/UrlDispatcher
    Disallow: /
    User-agent: WebEnhancer
    Disallow: /
    User-agent: suzuran
    Disallow: /
    User-agent: VCI WebViewer VCI WebViewer Win32
    Disallow: /
    User-agent: VCI
    Disallow: /
    User-agent: Szukacz/1.4
    Disallow: /
    User-agent: QueryN Metasearch
    Disallow: /
    User-agent: Openfind data gathere
    Disallow: /
    User-agent: Openfind
    Disallow: /
    User-agent: Xenu's Link Sleuth 1.1c
    Disallow: /
    User-agent: Xenu's
    Disallow: /
    User-agent: Zeus
    Disallow: /
    User-agent: RepoMonkey Bait & Tackle/v1.01
    Disallow: /
    User-agent: RepoMonkey
    Disallow: /
    User-agent: Microsoft URL Control
    Disallow: /
    User-agent: Openbot
    Disallow: /
    User-agent: URL Control
    Disallow: /
    User-agent: Zeus Link Scout
    Disallow: /
    User-agent: Zeus 32297 Webster Pro V2.9 Win32
    Disallow: /
    User-agent: Webster Pro
    Disallow: /
    User-agent: EroCrawler
    Disallow: /
    User-agent: LinkScan/8.1a Unix
    Disallow: /
    User-agent: Keyword Density/0.9
    Disallow: /
    User-agent: Kenjin Spider
    Disallow: /
    User-agent: Iron33/1.0.2
    Disallow: /
    User-agent: Bookmark search tool
    Disallow: /
    User-agent: GetRight/4.2
    Disallow: /
    User-agent: FairAd Client
    Disallow: /
    User-agent: Gaisbot
    Disallow: /
    User-agent: Aqua_Products
    Disallow: /
    User-agent: Radiation Retriever 1.1
    Disallow: /
    User-agent: Flaming AttackBot
    Disallow: /
    User-agent: Oracle Ultra Search
    Disallow: /
    User-agent: MSIECrawler
    Disallow: /
    User-agent: PerMan
    Disallow: /
    User-agent: searchpreview
    Disallow: /

  3. #3
    Member
    Real Name
    Stefan Eling
    Join Date
    Mar 2006
    Location
    munster, germany
    Posts
    30
    Liked
    1 times
    Beachtlichte Liste.

    Dann wird aber doch die Seite nicht mehr indiziert, oder?

  4. #4
    Senior Member Thomas Hoehl's Avatar
    Real Name
    Thomas
    Join Date
    Jul 2005
    Location
    Ockershausen, Germany
    Posts
    1,329
    Liked
    3 times
    Was den Yahoo! Slurp angeht habe ich seit Monaten folgendes erfolgreich im Einsatz:

    Yahoo Slurp Spider Aktivität begrenzen - Skats-Community
    Thomas Höhl / Crawlability Inc.
    vBSEO 3.3.2 freigegeben: vBSEO 3.3.2 veröffentlicht - Sicherheitsupdate

    vBSEO Styles: Version 1.0 PRO Für Alle Version 2.0 Für vBSEO Kunden


    Meine Seiten: www.vb-seo.de, www.ligafans.de und www.skats.de

  5. #5
    Senior Member °°Ben³'s Avatar
    Real Name
    Benjamin Klaile
    Join Date
    Jan 2006
    Location
    Remagen, Germany
    Posts
    113
    Liked
    0 times
    Guter Link.
    Werde ich auch mal drüber nachdenken. Müsste ich erstmal schauen, ob bei mir auch diese Lastspitzen auftreten und ich es nur nicht gemerkt habe.

  6. #6
    Member
    Real Name
    Stefan Eling
    Join Date
    Mar 2006
    Location
    munster, germany
    Posts
    30
    Liked
    1 times
    Na ja, Lastspitzen sind die eine Sache - wobei das eher zweitrangig ist wenn der Server genug Power hat.

    Viele Webmaster (ich inkl.) stellen auf ihren Seiten gerne da wieviele Leute sich gerade hier befinden. Nun schaut man nur einen Blick genauer hin und sieht, das die Hälfte Crawler sind. Das ist doch irgendwie super dämlich, oder?

    Ich hab jetzt:

    User-agent: Slurp
    Crawl-delay: 60


    im Einsatz (Danke für den Tipp) und die Anzeige der Besucher ist von 450 auf 200 tagsüber runtergegangen. Find' ich aber besser so.

  7. #7
    Senior Member
    Real Name
    Mario
    Join Date
    Oct 2006
    Posts
    237
    Liked
    0 times
    Quote Originally Posted by Steel View Post
    Beachtlichte Liste.

    Dann wird aber doch die Seite nicht mehr indiziert, oder?
    das sind die sog. bösen Spider die eh nur Mailaddys etc. suchen

    @Thomas Danke für den Tipp bzgl
    User-agent: Slurp
    Crawl-delay: 60

  8. #8
    Senior Member Hoffi's Avatar
    Real Name
    Christian
    Join Date
    Nov 2005
    Location
    Germany
    Posts
    330
    Liked
    2 times
    Blog Entries
    2
    Mal sehen wie das wirkt. die robots.txt ist mittlerweile locker 5kB groß, uff.

  9. #9
    Senior Member
    Real Name
    Mario
    Join Date
    Oct 2006
    Posts
    237
    Liked
    0 times
    Gibt es schon Erfahrungsberichte?

  10. #10
    Member
    Real Name
    Stefan Eling
    Join Date
    Mar 2006
    Location
    munster, germany
    Posts
    30
    Liked
    1 times
    Ja, es hilft.

    Habe für eine Übergangsphase dieses komische Slurb-Dingens komplett auf Disallow gesetzt. Jetzt sind tagsüber nur noch so zwei - vier auf der Startseite (tiefer dürfen sie ja nicht) unterwegs.

    Ich hab zwar ca. ein Viertel bis ein Drittel weniger online ausgewiesene Besucher, aber das passt schon

  11. #11
    Junior Member
    Join Date
    Sep 2005
    Posts
    28
    Liked
    0 times
    Habe den Slurp auch erstmal auf Disallow gesetzt, das ging ja gar nicht mehr.
    Dadurch ist es schon merklich besser mit der Performanz geworden.
    Zumindest meint das mein subjektives Empfinden.

  12. #12
    Senior Member Hoffi's Avatar
    Real Name
    Christian
    Join Date
    Nov 2005
    Location
    Germany
    Posts
    330
    Liked
    2 times
    Blog Entries
    2
    Ich hab da ehrlich gesagt bisher noch nicht drauf geachtet, aber neue Besucherrekorde bleiben bisher aus.

  13. #13
    Member
    Real Name
    Dominic
    Join Date
    Apr 2007
    Location
    Austria
    Posts
    31
    Liked
    0 times
    Bis jetzt hält sich's bei mir auch noch in Grenzen, auch wenn das Forum bei diversen (abstrusen) Stichwörtern auf den ersten paar Seiten steht bei Google.

Similar Threads

  1. The vBSEO LinkBacks User Guide - vBSEO 3.0 GOLD
    By Joe Ward in forum General Discussion
    Replies: 49
    Last Post: 09-20-2011, 08:10 PM
  2. vBSEO 3.0.0 freigegeben
    By Philipp Herbers in forum Deutsch
    Replies: 12
    Last Post: 04-20-2007, 02:51 PM

Posting Permissions

  • You may not post new threads
  • You may not post replies
  • You may not post attachments
  • You may not edit your posts
  •