PHPでスクレイピングのやり方メモ

すぐ忘れるのでメモ

<?php
$contents = file_get_contents('取得したいURL');
$dom = new DOMDocument();
@$dom->loadHTML( $contents );
$xpath = new DOMXpath( $dom );
echo $xpath->query( 'xPath文字列' )->item(0)->nodeValue;
?>

loadHTMLで@を付けているのは構文エラーがあるとWarningが発生し処理が停止してしまうため

以上

コメント

タイトルとURLをコピーしました