MyremixでMIXI日記を全文受信


いきなりですが、ネットで人の日記とか、ニュースとかを見るのにlivedoor ReaderというRSSreaderを使っています。
ふつーはそれぞれのサイトを巡回して、更新されてるか、確認するのが、まスタンダードな方法なのかな-と思うんですけど(巡回用のツールとかもあるけど)、RSSを読み込んでつらつらっと見れるほうがやっぱ楽。

でも、これにもいろいろと障害となるサイトがあって、まずは内容がわからないRSSを出すサイト。たとえばasahi.comあたりの大手ニュースサイトはRSSは提供しているものの、見出しだけなので内容は全くわからんのです。
そういったサイトは見てもらうことによって、広告収入なんかもあるので、当然サイトを見てもらわんと困るというのもあるのかも。そもそも、サイトのメタデータを提供する役目のRSSになんもかんも出せというのは酷な話かも、とは思いますが、エンドユーザーとしては、全部見たいと思わずにはいられんわけです。

もっと、最悪なのが、RSSすら出さないサイト。MIXIがその典型なんですけど、(元々クローズドなサービスではあるんでしょうが)そうともなると、RSSreaderではどうしようもないことになっちゃうわけです。

ただ、最近マッシュアップツールというのが普及し始めて、そういった問題も自己解決できるようになってきました。マッシュアップツールというのは、ネット上で出されているRSSなんかのメタデータを組み合わせて自分用にカスタマイズしたデータを出力できるようにするツール。代表格はyahoo pipesで、国内でもMyremixというサービスが登場しました。

こういうサービスを利用して、ytsuchiyamaさんはyahoo pipes使って大手ニュースサイトのニュースを全文受信するpipeを作ってます。(see ニュースのRSSを全文配信で読む – ytsuchiyamaの日記)他にも広告を削除したりと、無限にカスタマイズできるのが魅力。

ただ、yahoo pipesは、モジュールは豊富にあるものの、文字コードがutf-8でないと文字化けする(たぶん)という致命的な欠点があるせいで、日本語のRSSの二次的利用にはあんまり向かない気がします。

ということで、だいぶ前置きが長くなりましたが、マッシュアップツールの勉強がてら、Myremix使ってmixi日記を全文取得するRSSを作ってみました。 全体の流れは↓のような感じ。ログインモジュールから日記の本文をxpathで指定するscrapeモジュールに流します。後はその結果を出力するだけ。これを流すとRSSのdescriptionに日記の本文が出てきます。

ちなみに、scrapeモジュールの各項目には次の値を入力します。
URL:http://mixi.jp/new_friend_diary.pl
XPATH1://div[@id=’bodyMainArea’]/div[2]/ul
XPATH2://div[@id=’diary_body’]

もっとお手軽に使ってみたいという方のためにMIXIに登録しているアドレスとパスワードを登録するだけで全文RSSがとれるpipeも作ってみました。→MyRemix
自分のIDでしか試してないので、もしかするとうまくいかないかもしれないです。

実際使ってみての感想としては、いちいちmixiに行かなくても日記が読めるので、すこぶる便利。ほかにもいろいろ利用方法がありそうですが、いかんせんmyremix関連モジュールのドキュメントがないので、わかんねっす。そこんとこは中の人にお願いするしかあるまいか。 それとこれを動かしているせいで、1時間おきに足あとがついてしまいます。汚してしまいますがひらにご容赦を。