XPathを少しだけ触ったので備忘録。
正規表現みたいなものなんだね。いつかガッツリやりたい。
text() 指定で「今日」を指定し、後に続くリンクを「following-sibling::」で取得
完全一致
//*[@id="daily"]//span[text()='今日']/following-sibling::a[1]
部分一致
//*[@id="daily"]//span[contains(text(),'今日')]/following-sibling::a[1]
- 冒頭の @id=は、無くてもおそらく行けるのだが、無いと時間かかる
- 要素の中身のテキストを検索したい場合は、[contains(text(),'文字列')] で行けるらしい
- 冒頭だけでなく、途中の要素をすっ飛ばすというのも「//」でイケる
- 「次の要素」を指定できる「following-sibling::」
参照させていただいた記事はコチラ↓
●キャプチャがめっちゃ分かりやすい良雰囲気記事
クローラ作成に必須!XPATHの記法まとめ - Qiita
●「あれどうやるんだっけ」と見たくなるシンプル記事
HTML情報を取得する Xpath を覚えよう – Cloud Cafe
複雑な指定するにはもっとちゃんと勉強しなくちゃと思うけど、雰囲気は掴めた気がします。