だるろぐ

明日できることは、今日しない。

Omawari 1.0.0.0:Web 更新チェッカー的なものを作りました

f:id:daruyanagi:20170917040335p:plain

この前作ったスクレイピングサービスを Microsoft Azure Web Apps に載せたのですが……

blog.daruyanagi.jp

動かなかったので(そりゃそうか?)、WPF アプリケーションにしました。

f:id:daruyanagi:20170917040550p:plain

ターゲットとなる URI を登録すると、定期的にスクレイピングしてくれます。CSS セレクターが使えるので、ページの一部分だけ保存することが可能です*1。あと、シングルページアプリケーションのために、動的サイトをスクレイピングする機能を追加しました。

f:id:daruyanagi:20170917040812p:plain

ローカルに保存したログは、Diff をとってみることができます*2。データフォルダーをオンラインストレージに指定しておくと(初回利用時に選択できます)、複数環境でデータを同期できて便利かもしれない。

github.com

コードが汚いのをなんとかしたいのと、更新を検出したときにデスクトップ通知を出すだけだと見逃しちゃうかもなので、なんかいい方法を考えようかなと思います。

*1:全部を保存するときは“document”とか“body”とかしておけばいいと思う。そういえば試してないけど

*2:文字化けする……右クリックメニューからエンコーディングを UTF-8 にすると治せます