pythonで 検索エンジンの結果を一覧表示に挑戦
pythonで検索エンジンの結果を取得して、一覧表で出力したいので、プログラミングを
はじめました。
・プログラミング プロフィール
プログラミングは、visual basic 6.0 が結構やっていました。
windowsプログラミングはかなり離れてしまいましたが、pythonはインタプリタで動作するので
なんとかなるさで、はじめましたが、なんとかならない プログラミング。
-----------------------------------------------------------------------------
なんで、pythonはいろんなバージョンが乱立しているのか不明ですが、各バージョンを
インストール2.7 3.3 4.3 とりあえず html 読み込んでデータ加工だけできれば
目的達成なので、チェレンジしています
-----------------------------------------------------------------------------
いつも使う環境がproxyなしと、ありで 移動しているので、proxy 設定で まず
つまずき 第一関門
info@r7-yosou.hippy.jp
proxy なしでは、なんとか html コード取得
python 3.3
>>> import urllib.request
>>> import urllib
>>> response = urllib.request.urlopen('http://www.yahoo.co.jp')
>>> html = response.read()
>>> print (html)
htmlコードから、文字列が拾えない
---------------------------------------------------------------------------
とりあえず、外部リンク href とhttp だけ、取り出したい
まだ、出来ません (>_<)
----------------------------------------------------------------------------
回り道して、しまいました
lxml をインストール lxmlが強力なツールと書いてあり これでなんとかなるか
と インストール
windows版はmsi ファイルがあり、 通常のインストール画面が出て、
あっけなく完了。
そこまでも、時間がかかり、easy_install など いろいろ やってしまいました
結局 lxmlはXMLを読み込みツールなので、htmlは、どうでもよかったの
あー、
現在 htmlから hrefとhttpを 抽出できない
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
pyhton でgoogle検索エンジンが実現可能が判明
調べると、いろいろわかります。サーバー立ち上げるには、Linux、Appach、Php
が必要でしたが、
なんと、pythonで出来るんですね。
驚きました、早速構築
現在、進行形
これで、google 検索エンジンができれば、
はじめました。
・プログラミング プロフィール
プログラミングは、visual basic 6.0 が結構やっていました。
windowsプログラミングはかなり離れてしまいましたが、pythonはインタプリタで動作するので
なんとかなるさで、はじめましたが、なんとかならない プログラミング。
-----------------------------------------------------------------------------
なんで、pythonはいろんなバージョンが乱立しているのか不明ですが、各バージョンを
インストール2.7 3.3 4.3 とりあえず html 読み込んでデータ加工だけできれば
目的達成なので、チェレンジしています
-----------------------------------------------------------------------------
いつも使う環境がproxyなしと、ありで 移動しているので、proxy 設定で まず
つまずき 第一関門
info@r7-yosou.hippy.jp
proxy なしでは、なんとか html コード取得
python 3.3
>>> import urllib.request
>>> import urllib
>>> response = urllib.request.urlopen('http://www.yahoo.co.jp')
>>> html = response.read()
>>> print (html)
htmlコードから、文字列が拾えない
---------------------------------------------------------------------------
とりあえず、外部リンク href とhttp だけ、取り出したい
まだ、出来ません (>_<)
----------------------------------------------------------------------------
回り道して、しまいました
lxml をインストール lxmlが強力なツールと書いてあり これでなんとかなるか
と インストール
windows版はmsi ファイルがあり、 通常のインストール画面が出て、
あっけなく完了。
そこまでも、時間がかかり、easy_install など いろいろ やってしまいました
結局 lxmlはXMLを読み込みツールなので、htmlは、どうでもよかったの
あー、
現在 htmlから hrefとhttpを 抽出できない
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
pyhton でgoogle検索エンジンが実現可能が判明
調べると、いろいろわかります。サーバー立ち上げるには、Linux、Appach、Php
が必要でしたが、
なんと、pythonで出来るんですね。
驚きました、早速構築
現在、進行形
これで、google 検索エンジンができれば、