2017年9月19日火曜日

スクレイピーについて

あまプロではシステム開発の案件もお受けしています。
個人なんで、大きな案件には対応出来ませんが、国内の殆どは小さな案件の集まりです。

先日、スクレイピングの案件が有りまして、その中でScrapyというスクレイピングフレームワーク使う場面が有りました。
ページ内の要素をCSSセレクタで要素を指定するのですが、
ScrapyのCSSセレクタはtbody要素を無視する(認識しない)仕様みたいです
tbody要素をセレクタから削除すると意図しか結果になりました

小一時間悩みました…

0 件のコメント:

コメントを投稿

つっこみ