phpでrssの情報を抜き出したい場合は、titleやlinkの要素は以下の通りで抜き出せます。
<?php // Load and parse the XML document
$rss = simplexml_load_file('http://partners.userland.com/nytRss/nytHomepage.xml');
$title = $rss->channel->title;
?>
…
//mailto:が使用されているメールアドレス
preg_match_all(“/mailto:(.+?)”/s”, $html2, $matches);
//mailto:は使用されておらず、@を基準に判別
preg_match_all(‘/[-.w/]+@[-._[:lower:]d]+.[[:lower:]]{2,4}/s’, $html2, $matches);
または、
preg_match_all(‘/[-._a-zA-Z0-9/]+@[-._a-z0-9]+.[a-z]{2,4}/s’, $html2, $matches);
正規表現については、精度の問題もあり、意見が分かれるところだとは思いますが、私の場合は、これで十分だったので、メモとして残しておきます。
graffiti on the web
この投稿へのコメント
コメントはまだありません。