Coding345 Python Proxy check import urllib2, socket socket.setdefaulttimeout(180) # read the list of proxy IPs in proxyListproxyList = ['172.30.1.1:8080', '172.30.3.3:8080'] # there are two sample proxy ip def is_bad_proxy(pip): try: proxy_handler = urllib2.ProxyHandler({'http': pip}) opener = urllib2.build_opener(proxy_handler) opener.addheaders = [('User-agent', 'Mozilla/5.0')] urllib2.install_opener(opener) req=urllib2.R.. 2016. 1. 30. BeautifulSoup 웹파싱 [ex src]HomeSign up Login soup('input') : 모든 input 태그 반환-> [\n, ] soup('input')[0].string : 첫번째 input 태그의 string 반환-> soup.input['id'] : 첫번째 input태그의 id값 반환-> inputID soup.find_all('a') - 모든 a 태그 반환-> [Home, Sign up , Login] soup.find_all('a')[0].string - 첫번째 a태그의 string 반환-> Home soup.find_all('a')[0]['href'] - 첫번째 a태그의 href값 반환-> index.php 내용추가중.. 2016. 1. 29. Pytesser OCR import PILfrom PIL import Imagefrom pytesser import *import urllib # Downloadurllib.urlretrieve(주소, "codedown.png") # Resizingbasewidth = 300img = Image.open('codedown.png')wpercent = (basewidth/float(img.size[0]))hsize = int((float(img.size[1])*float(wpercent)))img = img.resize((basewidth,hsize), PIL.Image.ANTIALIAS)img.save('resize.png') # Readim = Image.open ('resize.png')text = image_to_stri.. 2016. 1. 27. Cannot send session cookie - headers already sent by 세션오류 session_start() 사용시 다음과 같은 에러가 발생한다면아래와 같이 처리를 해주면 된다. 1. session_start() 를 최상단에 써준다.2. UTF-8 BOM아님으로 저장한다.3. php.ini 에서 output_buffering 을 On 으로 수정해준다. 2016. 1. 24. 웹 에디터 Pingendo 부트스트랩으로 작업좀 하려다가 찾았다.진짜 편하다. 신세계다..필요한거 그냥 끌어다가 놓으면 알아서 생성된다. http://pingendo.com/ 2016. 1. 24. 소켓 통신할때 Response 못받아오는 문제 최근 소켓으로 통신할때 Response를 파싱하는 작업을 진행하다가제대로 받아오지 못하고 깨진 문자열을 반환하는 문제점을 발견했다. 해결법은 간단하다. 받아온 값을 decompress 해주면 해결되더라.(Request 보낼 때 Accept-Encoding 헤더를 지우면 되는경우도 있음) import gzipimport StringIO body = decompress할 값decompress = StringIO.StringIO(body)gzipper = gzip.GzipFile(fileobj=decompress)temp = gzipper.read()print temp 추가로 웹 크롤링 등의 작업을 할 때 gzip 등으로 compress 시켜주면 보다 빠른 속도로 진행이 가능하다고 한다.(서버에서 해당 인코딩.. 2016. 1. 8. 이전 1 ··· 49 50 51 52 53 54 55 ··· 58 다음