Получаем тИЦ и PR в формате XML
| Категория: PHP | Опубликовано 20-08-2011
2 комментария
На написание данного поста меня сподвигла вот эта тема на форуме Seobuilding.ru. В ней ТС рассказал, как получить тИЦ в формате XML – при помощи такой вот строчки:
http://bar-navig.yandex.ru/u?url=http://chiliec.ru&show=1
и задал вопрос: можно ли так же в XML получить значение PR.
Можно конечно делать это специальные сервисы, но это не надежно, да и бывают ограничения. Например здесь ограничение в 100 запросов в сутки.
Так что давайте напишем собственный скрипт. Для начала просто получим значение, а затем переведем его в XML. Далее привожу получившийся у меня код, а так же архив с исходниками.
<?php
function StrToNum($Str, $Check, $Magic)
{
$Int32Unit = 4294967296; // 2^32
$length = strlen($Str);
for ($i = 0; $i < $length; $i++) {
$Check *= $Magic;
//Если число с плавающей точкой превышает пределы целого (обычно +/- 2.15e+9 = 2^31),
//Результат преобразования в целое не определен
//См. http://www.php.net/manual/ru/language.types.integer.php
if ($Check >= $Int32Unit) {
$Check = ($Check - $Int32Unit * (int) ($Check / $Int32Unit));
//Если меньше чем -2^31
$Check = ($Check < -2147483648) ? ($Check + $Int32Unit) : $Check;
}
$Check += ord($Str{$i});
}
return $Check;
}
function HashURL($String)
{
$Check1 = StrToNum($String, 0x1505, 0x21);
$Check2 = StrToNum($String, 0, 0x1003F);
$Check1 >>= 2;
$Check1 = (($Check1 >> 4) & 0x3FFFFC0 ) | ($Check1 & 0x3F);
$Check1 = (($Check1 >> 4) & 0x3FFC00 ) | ($Check1 & 0x3FF);
$Check1 = (($Check1 >> 4) & 0x3C000 ) | ($Check1 & 0x3FFF);
$T1 = (((($Check1 & 0x3C0) << 4) | ($Check1 & 0x3C)) <<2 ) | ($Check2 & 0xF0F );
$T2 = (((($Check1 & 0xFFFFC000) << 4) | ($Check1 & 0x3C00)) << 0xA) | ($Check2 & 0xF0F0000 );
return ($T1 | $T2);
}
function CheckHash($Hashnum)
{
$CheckByte = 0;
$Flag = 0;
$HashStr = sprintf('%u', $Hashnum) ;
$length = strlen($HashStr);
for ($i = $length - 1; $i >= 0; $i --) {
$Re = $HashStr{$i};
if (1 === ($Flag % 2)) {
$Re += $Re;
$Re = (int)($Re / 10) + ($Re % 10);
}
$CheckByte += $Re;
$Flag ++;
}
$CheckByte %= 10;
if (0 !== $CheckByte) {
$CheckByte = 10 - $CheckByte;
if (1 === ($Flag % 2) ) {
if (1 === ($CheckByte % 2)) {
$CheckByte += 9;
}
$CheckByte >>= 1;
}
}
return '7'.$CheckByte.$HashStr;
}
function getpagerank($url) {
$query="http://toolbarqueries.google.com/tbr?client=navclient-auto&ch=".CheckHash(HashURL($url)). "&features=Rank&q=info:".$url."&num=100&filter=0";
$data=file_get_contents_curl($query);
$pos = strpos($data, "Rank_");
if($pos === false){} else{
$pagerank = substr($data, $pos + 9); //обрезаем лишнее
$pagerank = trim($pagerank); //удаляем перенос строки
return $pagerank;
}
}
function file_get_contents_curl($url) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_URL, $url);
$data = curl_exec($ch);
curl_close($ch);
return $data;
}
function xml($rank,$url){
$DOM = new DomDocument('1.0', 'windows-1251');
$root = $DOM->createElement('urlinfo');
$DOM->appendChild($root);
$child = $DOM->createElement('url','/');
$root->appendChild($child);
$child_att = $DOM->createAttribute('domain');
$child->appendChild($child_att);
$att_text = $DOM->createTextNode($url);
$child_att->appendChild($att_text);
$pr = $DOM->createElement('rank');
$root->appendChild($pr);
$child_att2 = $DOM->createAttribute('value');
$pr->appendChild($child_att2);
$att_text2 = $DOM->createTextNode($rank);
$child_att2->appendChild($att_text2);
$DOM->formatOutput = true;
$pagerank = $DOM->saveXML();
return $pagerank;
}
?>Теперь мы можем использовать функцию getPageRank($url), которая возвращает значение PR.
Например, так:
<?php
include('pagerank.php');
if (isset($_GET['url'])){
header('Content-Type: text/html; charset=windows-1251');
$getrank = getPageRank($url);
echo 'PR:',$getrank;
}Но ведь у нас основная задача – получить PR в XML. Для этого используем функцию xml($getrank,$url):
<?php
include('pagerank.php');
if (isset($_GET['url'])){
header('Content-Type: text/xml; charset=windows-1251');
$url = $_GET['url'];
$getrank = getPageRank($url);
print xml($getrank,$url);
}Демонстрация работы скрипта здесь, архив с исходниками здесь.





Написал вам в аську и тут продублирую:
У меня код не срабатывает, а у вас на сайте срабатывает. Начал разбираться – по этому url не находить подстроки «Rank_».
http://toolbarqueries.google.com/search?client=navclient-auto&ch=«.CheckHash(HashURL($url)). «&features=Rank&q=info:».$url.»&num=100&filter=0
Что вообщет выдает этот url?
Хм, в аську ничего не пришло (может антиспам не прошли?)
Гугл изменил урл
http://toolbarqueries.google.com/search?...
на
http://toolbarqueries.google.com/tbr?...
и я вроде давно его поправил здесь. Где вы его нашли?