Перейти к контенту

Добавление новых поисковых ботов


GiV

Рекомендуемые сообщения

Итак мы добавим следующих ботов: Aport, Yandex, Rambler.

 

Для этого открываем файл ./sources/functions.php и ищем следующие строки:

			$remap_agents = array(
							   'googlebot'	   => 'google',
							   'slurp@inktomi'   => 'inktomi',
							   'ask jeeves'	  => 'jeeves',
							   'lycos'		   => 'lycos',
							   'whatuseek'	   => 'wuseek',
							   'ia_archiver'	 => 'Archive_org', 

После них добавляем:

								   'aport'			  => 'Aport',
							   'yandex'		  => 'Yandex',
							   'stackrambler'	=> 'Rambler',

Чуть ниже идет строчка:

if ( preg_match( '/(googlebot|slurp@inktomi|ask jeeves|lycos|whatuseek|ia_archiver/i', $HTTP_SERVER_VARS['HTTP_USER_AGENT'], $match ) ) 

Заменяем ее на:

if ( preg_match( '/(googlebot|slurp@inktomi|ask jeeves|lycos|whatuseek|ia_archiver|aport|yandex|stackrambler)/i', $HTTP_SERVER_VARS['HTTP_USER_AGENT'], $match ) ) 

Еще ниже будет следующий код:

if ( ! $agent = $remap_agents[ $match[1] ] )

Заменим его на следующий:

				$match = strtolower($match[1]);
			if ( ! $agent = $remap_agents[$match] )

 

Все боты у нас есть. Теперь осталось дать им имена. Для этого осуществляем изменения в файле conf_global.php

Находим строчку:

$INFO['sp_google']			=	'GoogleBot';

и после нее добавляем:

$INFO['sp_Yandex']			=	'Yandex Bot';
$INFO['sp_Rambler']			=	'Rambler Bot';
$INFO['sp_Aport']			=	'Aport Bot';

 

Вот вроде и все. За информацию по русским ботам благодарим портал http://www.searchengines.ru/

Ссылка на комментарий
Поделиться на других сайтах

  • Ответы 131
  • Создана
  • Последний ответ

Лучшие авторы в этой теме

Лучшие авторы в этой теме

Теперь осталось дать им имена. Для этого осуществляем изменения в файле conf_global.php
Находим строчку:

 

CODE 

$INFO['sp_google']            =    'GoogleBot';

 

У меня нету этой строки в файле conf_global.php.

Ссылка на комментарий
Поделиться на других сайтах

Открываем файл: ad_settings.php

Находим:

$this->save_config( array (  'spider_suit', "spider_sense","spider_visit","spider_group","spider_active",'sp_google' ,'sp_inktomi','sp_lycos'  ,'sp_jeeves','sp_wuseek', 'spider_anon' ));

Заменяем на:

$this->save_config( array(  'spider_suit', "spider_sense","spider_visit","spider_group","spider_active",'sp_google' ,'sp_inktomi','sp_lycos'  ,'sp_jeeves','sp_wuseek', 'spider_anon', 'sp_Yandex', 'sp_Rambler', 'sp_Aport' ));

Находим:

$ADMIN->html .= $SKIN->add_td_row( array( "<b>Переименовать What U Seek в...</b>" ,
                                         $SKIN->form_input( 'sp_wuseek' , $INFO['sp_wuseek']  == "" ? 'What U Seek' : $INFO['sp_wuseek'] )
                                 )      );

Добавим ниже:

        $ADMIN->html .= $SKIN->add_td_row( array( "<b>Переименовать Yandex в...</b>" ,
                                         $SKIN->form_input( 'sp_Yandex' , $INFO['sp_Yandex']  == "" ? 'Yandex'   : $INFO['sp_Yandex'] )
                                 )      );

        $ADMIN->html .= $SKIN->add_td_row( array( "<b>Переименовать Rambler в...</b>" ,
                                         $SKIN->form_input( 'sp_Rambler' , $INFO['sp_Rambler']  == "" ? 'Rambler'   : $INFO['sp_Rambler'] )
                                 )      );

        $ADMIN->html .= $SKIN->add_td_row( array( "<b>Переименовать Aport в...</b>" ,
                                         $SKIN->form_input( 'sp_Aport' , $INFO['sp_Aport']  == "" ? 'Aport'   : $INFO['sp_Aport'] )
                                 )      );

И меняем имена в админке.

Так проще. :D

Ссылка на комментарий
Поделиться на других сайтах

как же все таки это сделать для 1.1.х :D я понимаю, Оска уже ругался что для этой версии скорей всего ничего не будет ... но так апгрейдиться не хочеться, прижился ;)
Ссылка на комментарий
Поделиться на других сайтах

  • 2 недели спустя...
Гым.. то ли я что-то не так поставил, то ли что, но эти действия проблемы с Яндексом не решают. В логах и в списке пользователей яндексовский бот появляется, однако форум все равно выдает ему s=1q2w3esomething.
Ссылка на комментарий
Поделиться на других сайтах

Vanish

Загляни, плиз, в темку по 1.1 - у меня трабла..

 

И ещё: а под 1.1 также добавлять ботов или какие-то тонкости есть?

 

С наступающим!

Ссылка на комментарий
Поделиться на других сайтах

  • 1 месяц спустя...
А зачем это нужно вообще? Просто чтоб видеть когда бот у тебя на форуме?

Да, чтобы видеть в списке пользователей сидит ли бот и где?

А через админцентр следить за логами, где прошел бот, что проиндексировал...

Ссылка на комментарий
Поделиться на других сайтах

  • 4 недели спустя...

Что, никто не знает?

На этом форуме отображается Yahoo! в онлайне.

Поделитесь его именем, таким как aport yandex stackrambler ia_archiver и т.д.

Ссылка на комментарий
Поделиться на других сайтах

Fastserg

Как зовут бота yahoo ?

user_agent его:

Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)

Ищи Yahoo в юзер агент или Yahoo! Slurp, и будет тебе счастье... :D

Ссылка на комментарий
Поделиться на других сайтах

Fastserg

Я не про логи сервера, а про логи ботов на форуме.

Так эти логи по user agent работают....

Посмотри в functions.php как это реализовано.

Ссылка на комментарий
Поделиться на других сайтах

Млин я уже смотрел поэтому и спрашиваю как зовут yahoo бота

 

Код в functions.php

 

   
       	$remap_agents = array(
       						   'googlebot'     => 'google',
       						   'slurp@inktomi' => 'inktomi',
       						   'ask jeeves'    => 'jeeves',
       						   'lycos'         => 'lycos',
       						   'whatuseek'     => 'wuseek',

Ссылка на комментарий
Поделиться на других сайтах

Млин я уже смотрел поэтому и спрашиваю как зовут yahoo бота

Насколько я помню, полное имя не требуется - хоть бы просто часть. Или я неправильно помню? :D

Ссылка на комментарий
Поделиться на других сайтах

А длина этой строки в functions.php чем-то ограничена или нет?

 	if ( preg_match( '/(googlebot|slurp@inktomi|ask jeeves|lycos|whatuseek|ia_archiver|aport|yandex|stackrambler|scooter|Yahoo|FAST-WebCrawler|Gigabot|ZyBorg|Fast Web Crawler|Openbot|libwww-FM)/i', $HTTP_SERVER_VARS['HTTP_USER_AGENT'], $match ) )

Ссылка на комментарий
Поделиться на других сайтах

Fastserg

А длина этой строки в functions.php чем-то ограничена или нет?

Только твоей фантазией :D

Ссылка на комментарий
Поделиться на других сайтах

Fastserg

Млин я уже смотрел поэтому и спрашиваю как зовут yahoo бота

Смотришь логи сервака. Если слово Yahoo в user_agent однозначно определает Yahoo, то так его и называй.

Ссылка на комментарий
Поделиться на других сайтах

Sanjak

Спасибо ВСЕМ.

Уже давно разобрался.

Yahoo! Slurp не катит.

У меня получилось yahoo. иначе не определялся. Когда использовал Yahoo он почему-то googlebot-ом определялся... :D

Ссылка на комментарий
Поделиться на других сайтах

Fastserg

Напиши тут имена всех поисковиком.

Хочу и себе добавить, что б знать хто по форуму шастается :D

Ссылка на комментарий
Поделиться на других сайтах

Вот что у меня в functions.php. Дальше думаю разберешься.

 

	$remap_agents = array(
       						   'googlebot'     => 'google',            // [url="http://www.google.com"]http://www.google.com[/url]
       						   'slurp@inktomi' => 'inktomi',          // [url="http://www.inktomi.com"]http://www.inktomi.com[/url]
       						   'ask jeeves'    => 'jeeves',
       						   'lycos'         => 'lycos',           // [url="http://www.lycos.com"]http://www.lycos.com[/url]
       						   'whatuseek'     => 'wuseek',
       						   'ia_archiver'   => 'Archive_org',      // [url="http://www.alexa.com/"]http://www.alexa.com/[/url]
                                  'aport'         => 'Aport',
                                  'yandex'        => 'Yandex',
                                  'stackrambler'  => 'Rambler',
                                  // Äîáàâèë åùå íå ïðîâåðííûõ
							         'scooter'          =>  'Altavista',    //http://www.altavista.com/
                                        'yahoo'            =>  'Yahoo',               //http://yahoo.com
                                  //      'FAST-WebCrawler'  =>  'AllTheWeb',    //http://www.alltheweb.com/ Ôèãíÿ
                                        'Gigabot'          =>  'Gigablast',    //http://www.gigablast.com/
                                        'zyborg@looksmart'           =>  'WiseNut',      //http://www.wisenut.com/ [url="http://www.WISEnutbot.com"]http://www.WISEnutbot.com[/url]
                                        'WebCrawler'       =>  'Fast',         //http://fast.no/index.asp
                                        'Openbot'          =>  'Openfind',     //http://www.openfind.com.tw/
                                        'libwww'           =>  'libwww-FM',        //http://punto.ru
       						 );

       	if ( preg_match( '/(googlebot|slurp@inktomi|ask jeeves|lycos|whatuseek|ia_archiver|aport|yandex|stackrambler|scooter|yahoo|Gigab
ot|zyborg@looksmart|WebCrawler|Openbot|libwww)/i', $HTTP_SERVER_VARS['HTTP_USER_AGENT'], $match ) )
       	{

 

Еще если хочешь поможешь сделать user_agent в онлайне для админов.

http://www.ipbrus.meoko.com/forum/index.php?showtopic=7

Ссылка на комментарий
Поделиться на других сайтах

У Вас нет прав просмотра этой темы

 

че шифроватся то?

Ссылка на комментарий
Поделиться на других сайтах

Присоединиться к обсуждению

Вы можете ответить сейчас, а зарегистрироваться позже. Если у вас уже есть аккаунт, войдите, чтобы ответить от своего имени.

Гость
Unfortunately, your content contains terms that we do not allow. Please edit your content to remove the highlighted words below.
Ответить в этой теме...

×   Вы вставили отформатированный текст.   Удалить форматирование

  Допустимо не более 75 смайлов.

×   Ваша ссылка была автоматически заменена на медиа-контент.   Отображать как ссылку

×   Ваши публикации восстановлены.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

Зарузка...

×
×
  • Создать...

Важная информация

Находясь на нашем сайте, вы соглашаетесь на использование файлов cookie, а также с нашим положением о конфиденциальности Политика конфиденциальности и пользовательским соглашением Условия использования.