2015年6月1日月曜日

pythonで 検索エンジンの結果を一覧表示に挑戦

pythonで 検索エンジンの結果を一覧表示に挑戦


 pythonで検索エンジンの結果を取得して、一覧表で出力したいので、プログラミングを

 はじめました。

 ・プログラミング プロフィール 

  プログラミングは、visual basic 6.0 が結構やっていました。

  windowsプログラミングはかなり離れてしまいましたが、pythonはインタプリタで動作するので

 なんとかなるさで、はじめましたが、なんとかならない プログラミング。

 -----------------------------------------------------------------------------

 なんで、pythonはいろんなバージョンが乱立しているのか不明ですが、各バージョンを

 インストール2.7 3.3 4.3 とりあえず html 読み込んでデータ加工だけできれば

 目的達成なので、チェレンジしています

-----------------------------------------------------------------------------
 
 いつも使う環境がproxyなしと、ありで 移動しているので、proxy 設定で まず

 つまずき 第一関門



info@r7-yosou.hippy.jp



 proxy なしでは、なんとか html コード取得

 python 3.3

 >>> import urllib.request

>>> import urllib

>>> response = urllib.request.urlopen('http://www.yahoo.co.jp')

>>> html = response.read()

>>> print (html)


 htmlコードから、文字列が拾えない

---------------------------------------------------------------------------

 とりあえず、外部リンク href とhttp だけ、取り出したい

 まだ、出来ません (>_<)

----------------------------------------------------------------------------

 回り道して、しまいました

 lxml をインストール lxmlが強力なツールと書いてあり これでなんとかなるか

 と インストール

 windows版はmsi ファイルがあり、 通常のインストール画面が出て、

 あっけなく完了。

 そこまでも、時間がかかり、easy_install など いろいろ やってしまいました


 結局 lxmlはXMLを読み込みツールなので、htmlは、どうでもよかったの

 あー、
  
 現在 htmlから hrefとhttpを 抽出できない


ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

 pyhton でgoogle検索エンジンが実現可能が判明

 調べると、いろいろわかります。サーバー立ち上げるには、Linux、Appach、Php

 が必要でしたが、

 なんと、pythonで出来るんですね。

 驚きました、早速構築

 現在、進行形

 これで、google 検索エンジンができれば、