Skip to content

ローカルHTMLファイルからリンクURLを抜きだすperlスクリプト

2015年2月8日

メモ。HTML::TokeParserが必要。
Usage: ./getURL.pl [HTMLFile]

getURL.pl============

#!/usr/bin/perl

use HTML::TokeParser;

$p = HTML::TokeParser->new($ARGV[0]) or die($!);

while( $token = $p->get_tag(“a”)){
    $href = $$token[1]{‘href’};
    print $href.”\n” if ($href);
}

====================

広告

From → 未分類

コメントする

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

%d人のブロガーが「いいね」をつけました。