ニックジャガー日記

勝手気ままだけど自分に素直なブログ

やってみるもの

seleniumは指定の仕方が簡単

Webスクレイピングは一旦URLからそのhtmlをとってきて解析が必要だけれど

自動徘徊はボタンを押すだけだから解析は必要ない

 

といってもWebのソースコードを見る必要があるけれど・・

 

f:id:nickjagar:20200425233826p:plain

こんなコードのタグ、上の例えば<article id=...
となっているところのarticleを指定する

 

その指定の仕方もXpathという指定の仕方をすると簡単。

どうして簡単かというと、いちいちフルパスを書く必要がない。

//article[@id="..."]

とすればいい。Xpathも一応勉強して、しばらく試行錯誤

 

この試行錯誤で覚える。

何度も失敗してようやく動かせるようになった頃に

はじめてXpathの意味や指定の仕方がわかる

 

なんでもやってみることが大事

 

参考にしてブログはこちら(これが元)

selenium-python.readthedocs.io

 

そして日本語での解説では、ここを参考にしました。

kurozumi.github.io

 

とりあえず、これで動かした。

これで目標は達成。なんだか思ったより早い。

 

069/100

#100DaysOfCode