HTMLデータをスクレイピング

電脳備忘録
simplehtmldomとhtmlsqlでスクレイピングをしています。 HTMLデータを直にスクレイピングしたい場合は「str_get_html」を使えばいいみたい。
$html = str_get_html($scrapedata);
htmlsqlでざっくりスクレイピングしてデータベースに格納したデータをPHP Simple HTML DOM Parserでスクレイピングして表示させてみたときの覚書
while($row = $sth->fetch(PDO::FETCH_NUM)){
$scrapedata = $row[1];
$categories = $row[2];
$html = str_get_html($scrapedata);		
$PageURL= $html->find('a');
$ThumbURL= $html->find('img');
$URLPageURL= $PageURL[0]->href;
$URLThumbURL= $ThumbURL[0]->src;
echo 'URL:'.$URLPageURL.'ThumbURL:'.$URLThumbURL.'
'; }//while
データベースにhtmlsqlでざっくりスクレイピングしたデータがあって、そのデータを$scrapedata格納して、この中からURLと画像URLをスクレイピングしています。
Newer
Older
Dark
Light
menu