自分用メモ
$html = ブログから抜き出したソース;
preg_match("/抜き出すパターン/", $html);
最初は正規表現が間違っているのかと思い、いくつか正規表現のパターンを変えてテストしてみましたが、手ごたえなし(´;ω;`)ウッ…
正規表現以外の問題だと思い、さらに基本的なことを調べてみると・・・
「検索対象の文字列が1行か、複数行か。」
ここが問題だったようです…
phpでGoogleのページランクを取得するプログラムを作りたいなぁと思っていたのですが、日本にはそれらしい情報が少なかったり、記事が見つかっても古くなっていて、現時点では正常に動作しないプログラムだったり、実際のページランクと違ったり、という状態がここ一週間ほど続いてました。
ページランクの取得にGoogleにクエリを送るのは規約違反ですし、GoogleのAPIなどを見てもページランクを取得できそうなものが見当たらず、Googleツールバー以外からページランクが取得されるのもGoogle的には嫌なのか、Googleのページランクのアルゴリズムも常に変化しているようです。
以前は、ページランクを決めるのに重要なch値(チェックサム?)が6から始まる数字だったのですが、現在は7から始まるものらしく、少々時間はかかりましたが、それらしいものは出来ました。
ページランク取得ツールはこちら
被リンク元のページランクを調べるツールはこちら
参考サイト(http://www.hm2k.com/)
この投稿へのコメント
コメントはまだありません。