본문 바로가기
반응형

Python/Python 자동화3

pyqt selenium 채권 정보 크롤링 (3): python활용한 채권 데이터 크롤링 구현 라이브러리 불러오기 from selenium import webdriver from selenium.webdriver.chrome.options import Options # 옵션 from selenium.webdriver.chrome.service import Service from webdriver_manager.chrome import ChromeDriverManager from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys import requests from bs4 import BeautifulSoup import pandas as pd 셀레니움 사용을 위해 selenium 및 reque.. 2023. 7. 3.
pyqt selenium 채권 정보 크롤링 (2): 채권 데이터 크롤링 전략 수립 이전 시간에는 크롤링 대상 사이트를 탐색했었는데요(다른 사이트도 선택해 비슷하게 진행가능). 저는 신한투자증권 장내 채권 사이트를 선정했었습니다. https://www.shinhansec.com/siw/wealth-management/bond-rp/590401/view.do 이번 시간에는 선정한 사이트 채권 정보를 가져오는 내용을 리뷰해볼게요. 위에 보이는 테이블은 스크롤을 내리면 자동으로 채권들이 리젠되는 구조로 되어있습니다. 테이블에 존재하는 모든 채권을 가져오려면, 맨 아래에 있는 채권까지 다 리젠이 되어야 되기 때문에, 테이블 스크롤을 가장 아래로 내리는 작업이 필요합니다. 이 과정에서 Selenium(셀레니움)을 사용해 자동으로 스크롤을 맨 아래로 내리고, 모든 요소를 긁어오겠습니다. div 태.. 2023. 6. 23.
pyqt selenium 채권 정보 크롤링 (1): 데이터 수집 사이트 탐색 안녕하세요, 오늘 소개드릴 자동화는 셀레니움을 이용한 채권 정보 자동 수집입니다. 저의 경우, 채권 투자를 하고있는데요. 앱이나 사이트에서는 단순 채권 목록을 쭉 보여주는 것에 불과하거나, 제가 사용하지 않는 부가적인 기능이 많아 사용하기 불편했습니다. 그래서, 제가 자주 보는 정보 위주로 필터링하고 정렬하는 프로그램을 만들어 보겠습니다. 우선, 채권 정보를 빠르고 쉽게 수집할 사이트를 선정합니다. 저는 신한투자증권 장내 채권 사이트를 선정했습니다. (https://www.shinhansec.com/siw/wealth-management/bond-rp/590401/view.do) 채권명, 거래량, 수익률 정도를 빠르게 스키밍하고 재무재표를 볼 생각이었습니다. (신용등급, 만기일은 나중에 추가 고려대상) .. 2023. 6. 18.
반응형