PyGoogleを使って定期的にCOREBlogサイトを探索しています。
- Googleが返してきたURLにCOREBlog固有のURLをつけてCOREBlogかどうか判別。Zopeには 獲得 があるので,ひと階層ずつ上っていってCOREBlogインスタンスのベースを特定。これを日次で行う
- 発見したCOREBlogサイトのRDFを取得してパース。新着のみ取得してCentralCore MLに配信
他にも,定期的に検索っぽいことをして発見したURLをMLに配信しています。MLに配信されたURLをベースに,ニュースを選り分けている訳です。
日本のZope情報は「人力」が命なわけですが,できるだけ手間を省くような仕組みが必要と考えていました。コンテクストのない,タイトルとURLのみの配信なので,コツコツと続けることがなにより大事。続けるためには手間かかからない方がよい。
スタッフの方々の協力があり,これまで一日も途絶えることなくニュースを配信してこれました。ログを見ると,日増しに認知度が高まっていくようです。また,日本のZope情報が,Zopeの情報を発信している方々の励みになってくれればと思って続けています。
あと一週間で初めて一ヶ月になります。三ヶ月続いたらお祝いをしようと約束しています。