修正と XML-RPC と BOM
「ココログの過去ログ・アーカイブ作成」を修正しました。ココログから流用した CSS での表示が IE でおかしくなる( h1 タイトルが h2 と重なる等)のを直したのですが、ついでなので色々と強化。ベーシックテンプレートで使われている style 要素を流用する程度ならそのまま使えるはず。
でも実を言えばこれみたく XML-RPC でデータを取り出すよりも「記事を書き出す(エクスポート)」で出来るファイルからデータを読み込む方が簡単かつ情報量が多かったりします。逆に、エクスポートのファイルに無くて XML-RPC だと取得できる情報は固定リンクの URL のみ。(それだけなら metaWeblog.getRecentPosts 一回で取得出来てしまいます。)
このプログラムだとカテゴリーとトラックバックを取得するため 1 post に付き2回のアクセスがあるせいで 2 post/秒くらいの速度しか出ません。40 post そこそこの、この blog ですら24秒くらい掛かってしまいます。元々は XML-RPC のサンプルを作るつもりでいじっていたのが何となく肥大してしまっただけの代物なので実用上の優劣を気にしてはいませんでしたが……。
ついでに「utf-8 テキストファイルの <, >, & を html 用にエスケープ」の方も訂正。こちらは BOM 付きテキストを処理した時に <pre> の次にその BOM を挟み込んでしまうのを直しました。 pre 要素に入れる処理はこちらに投稿する時に後付けしたのでちゃんとテストしていなかったのが敗因。
まあ BOM は ZERO WIDTH NON-BREAKING SPACE
でもあるわけですから文書中の何処にあっても問題ないはずですが、世の中そんなに甘くは無いわけで……。
« utf-8 テキストファイルの <, >, & を html 用にエスケープ ver.1.0.1 | トップページ | アカウントやパスワードをソースに置かない »
「ウェブログ・ココログ関連」カテゴリの記事
- ココログオリジナルテーマにココロちゃんが無い!(2010.05.28)
- はてなしてます(2008.11.02)
- ココロのパンの缶詰(2008.08.10)
- こういうときに限って驚くほど初音ミク オリジナルが生きてくるものなのだ。(2008.01.21)
- ブログ妖精と VOCALOID とオプション(2008.01.06)
「Python」カテゴリの記事
- from __future__ import hatsune(2008.09.15)
- Pygame1.8.1出たよ!(2008.08.02)
- それは kokoro.py と言うプログラム(2008.04.27)
- smf2txt.py ‐ SMF をテキストに(2008.04.09)
- 2007年下半期ライトノベルサイト杯結果と、同じのに投票した方々(2008.01.28)
« utf-8 テキストファイルの <, >, & を html 用にエスケープ ver.1.0.1 | トップページ | アカウントやパスワードをソースに置かない »