![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/bIev9G/btr2ufgFK0f/SyNFduBHiB91GXGsnLDOI1/img.png)
(내용입력) https://tinyjpg.com/ TinyJPG – Compress WebP, PNG and JPEG images intelligently Make your website faster and save bandwidth. TinyJPG is the best automatic WEBP, JPEG and PNG optimizer and compresses your WEBP, JPEG and PNG images by 40-60%! tinyjpg.com
카테고리 없음
2023. 3. 7. 10:32
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/barMG8/btr2gjLmziE/onKGYx9ijSerkr9kJdNLBk/img.png)
파이썬을 통해 자동화할때 웹페이지에서 필요한 정보를 가져올때 해당 태그를 찾아 xpath 또는 css selecter를 이용하여 text 값을 추출할 수 있다. 하지만 매번 태그값이 변경된다면 그에 맞게 변경해줘야 함으로 그냥 html을 통으로 가져와서 파싱하는 방법도 존재한다. 이를 위해서는 html 전체 코드를 문자열로 가져온 후 태그를 제거하여 필요한 부분을 찾으면 된다. 파이썬에서 HTML 태그를 제거하는 정규식을 작성하면 된다. import re html_string = "이것은 HTML 문자열입니다." no_html_string = re.sub(r']*>', '', html_string) print(no_html_string) # "이것은 HTML 문자열입니다." 네, 각 줄에 대한 설명은 다..
카테고리 없음
2023. 3. 7. 09:17
한국어 OCR 파이썬 라이브러리 종류 및 추천
뉴빙 이용해서 한국어 OCR 잘 되는거 물어봄
카테고리 없음
2023. 3. 6. 09:45