2009年12月05日 過去Blog
phpでrssの情報を抜き出したい場合は、titleやlinkの要素は以下の通りで抜き出せます。
<?php // Load and parse the XML document
$rss =  simplexml_load_file('http://partners.userland.com/nytRss/nytHomepage.xml');
$title =  $rss->channel->title;
?>
<html xml:lang=”en” lang=”en”> <head> <title><?php echo $title; ?></title> </head> <body> <h1><?php echo $title; ?></h1> <?php // Here we’ll put a loop to include each item’s title and description foreach ($rss->channel->item as $item) { echo “<h2><a href='” . $item->link . “‘>” . $item->title . “</a></h2>”; echo “<p>” . $item->description . “</p>”; } ?> </body> </html> 最初に書いた通り、上記でtitleなどは取得出来ますが、<content:encoded>など、
<![CDATA[
が含まれる箇所が取得できません。 そこで、「MagpieRSS – PHP で使える RSS パーサー。」を参考にMagpieRSSというものを利用しました。

使い方

index.php に http://yamazon.org/feed のRSSを埋め込むとして手順を示します。
  • http://magpierss.sourceforge.net/ で MagpieRSS (magpierss-0.3.tar.gz) を入手。
  • magpierss-0.3.tar.gz を解凍。
  • 拡張子が .inc のファイルと extlib フォルダを index.php と同じディレクトリにアップロード。
  • 同じディレクトリ(サーバ上)の下に cache という名前のディレクトリを作る。
  • index.php の中のヘッドラインを埋め込みたい位置に以下のコードを挿入。
以上の設定が完了したら、以下のようなソースで抜き出します。
<?php
include('rss_fetch.inc');

$url = "http://yamazon.org/feed";
$rss = fetch_rss($url);

if($rss){
$items = $rss->items;
foreach($items as $item){
$content = $item["content"]["encoded"];
$content = mb_convert_encoding($content, "UTF-8", "auto");
echo $content;
}
}else{
echo "file not found.";
}
?>
これで、<content:encoded>が抜き出せましたが、文字化けしてしまいました。 mb_convert_encodingでエンコードしても文字化けのまま・・・。(どうやらASCIIに変換されている模様?) 文字化けについては解決次第、報告しようと思います。

<追記>

文字化けの件が解決したのでメモしておきます。

(Jcode.phpを使う方法 – mb_convert_encodingが使えない場合の解決法その1)

  • http://www.spencernetwork.org/jcode/ でJcode.php(jcode_1.34.zip)を入手。
  • jcode_1.34.zip を解凍。
  • jcode.phps を jcode.php に拡張子を変えた後、readme.txt 以外のファイルを同じディレクトリにアップロード。(jcode.php と code_table.ucs2jis のみでも可)
  • コードを以下の様に変更。
 <?php
//MagpieRSS
 include('rss_fetch.inc');
 require_once 'code_table.ucs2jis';
 require_once 'jcode.php';

 $url = $search_domain;
 $rss = fetch_rss($url);

 $title = $rss->channel["title"];
 //JcodeConvert($str, $from, $to) 0:PASS(無変換)1:EUC-JP 2:Shift_JIS 3:ISO-2022-JP(JIS) 4:UTF-8
 //今回は変換元がEUC-JPだったので、PASS,4 でUTF-8に変換してます。
 $title = JcodeConvert($title, 0, 4);

 echo $title;

 if($rss){
 $items = $rss->items;
 foreach($items as $item){
 $content = $item["content"]["encoded"];
 $url   = $item["link"];

 $content = JcodeConvert($content, 0, 4);
 echo $url;
 echo $content;

 }
 }else{
 echo "file not found.";
 }
//MagpieRSS
 ?>
私の場合は以上で、文字化けもなく <![CDATA[ が含まれる要素も全て取得出来ました。 RSSを取得する、その他の方法として

XML::FeedPPで、content:encodedなどを取得する方法

などもあるようです。
//JcodeConvert($str, $from, $to) 0:PASS(無変換)1:EUC-JP 2:Shift_JIS 3:ISO-2022-JP(JIS) 4:UTF-8
http://www.doyouphp.jp/php5/php5_simplexml.shtml

この投稿へのコメント

コメントはまだありません。

コメントを残す

メールアドレスが公開されることはありません。

次のHTML タグと属性が使えます。
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

CAPTCHA


ピックアップ記事

Word Pressの自動アップグレードに失敗する

2011年01月12日 過去Blog
ルートディレクトリが見つかりません ディレクトリが見つからない関連のエラーは以下のように、「wp-config.php」に追加すれば、直るようです。 参考:「wp-config.php_の編集」 define('FTP_BASE', '/path/to/wordpress/'); define('FTP_CONTENT_DIR', '/path/to/wordpress/wp-content/'…
「Word Pressの自動アップグレードに失敗する」をはてなブックマークに追加

iPhoneのマルチタスク時の不要なメモリ解放

2011年01月05日 過去Blog
タイトルの通りですが、マルチタスクのメモリを解放する方法は、ホームボタンをダブルクリックして、起動中のアプリを表示させ、削除したいアプリを長押しすれば、削除ボタンが現れて削除可能になります。 どうも手動で管理しないといけないというのは、不便ですね。 他にもっと良い方法はないんでしょうかね( ? _ ? ) ご存知の方は、是非コメント下さい(^_^)
「iPhoneのマルチタスク時の不要なメモリ解放」をはてなブックマークに追加

iTunes Store の購入履歴とオーダー(注文)番号を表示する方法

2011年01月12日 過去Blog
iTunes Store の購入履歴とオーダー(注文)番号を表示する方法
iTunes Store の購入履歴とオーダー(注文)番号を表示する方法 iTunes がインストールされているコンピュータをお使いの場合は、こちら をクリックすると、 iTunes を起動して購入履歴を表示できます。Apple ID とパスワードの入力を求められます。 次の手順で iTunes Store および Mac App Store で購入したコンテンツのリストを表示することもできます。…
「iTunes Store の購入履歴とオーダー(注文)番号を表示する方法」をはてなブックマークに追加

zencart META内のauthor、generatorの設定

2010年06月29日 過去Blog
includes/templates/テンプレート名/common 内のhtml_header.phpを編集。 What is Darvocet?…
「zencart META内のauthor、generatorの設定」をはてなブックマークに追加

ドット・ストライプなど背景画像作成

2011年01月26日 過去Blog
ドット背景 http://www.pixelknete.de/dotter/index.php ストライプ背景 http://www.stripegenerator.com/ その他(タータン柄) http://www.tartanmaker.com/ atlanta plastic surgery when to take omega 3…
「ドット・ストライプなど背景画像作成」をはてなブックマークに追加
© graffiti on the web . All rights reserved. WordPress Theme by comfy