안녕하세요 늑대양입니다 :)
오늘은 [AI 데이터 사이언티스트 취업 완성 과정]의 10일차 일과를 정리하여 안내해드리도록 하겠습니다.

Day 10. 시간표:
- 선택 학습
- 오프라인 강의: [웹크롤링 기본 (파이썬 라이브러리)]
Day 10. 온라인 학습 범위 (선택사항):
- 9강
- 예상 학습 시간: 4:36:10
대주제(Part) | 중주제(Chapter) | 소주제(Clip) |
Part.3 파이썬 기초와 데이터분석 | Chapter.02 데이터 분석 라이브러리 | CH02_01. Numpy를 사용하는 이유 |
Part.3 파이썬 기초와 데이터분석 | Chapter.02 데이터 분석 라이브러리 | CH02_02. Numpy array |
Part.3 파이썬 기초와 데이터분석 | Chapter.02 데이터 분석 라이브러리 | CH02_03. Numpy method |
Part.3 파이썬 기초와 데이터분석 | Chapter.02 데이터 분석 라이브러리 | CH02_04. Pandas를 사용하는 이유 |
Part.3 파이썬 기초와 데이터분석 | Chapter.02 데이터 분석 라이브러리 | CH02_05. Pandas DataFrame |
Part.3 파이썬 기초와 데이터분석 | Chapter.02 데이터 분석 라이브러리 | CH02_06. Pandas method |
Part.3 파이썬 기초와 데이터분석 | Chapter.02 데이터 분석 라이브러리 | CH02_07. Seaborn을 사용하는 이유 |
Part.3 파이썬 기초와 데이터분석 | Chapter.02 데이터 분석 라이브러리 | CH02_08. pyplot 기초 |
Part.3 파이썬 기초와 데이터분석 | Chapter.02 데이터 분석 라이브러리 | CH02_09. seaborn plots |
Part.3 파이썬 기초와 데이터분석:
Chapter.02 데이터 분석 라이브러리:
01. Numpy를 사용하는 이유:
Numpy: Numerical computing with Python. 수치연산 및 벡터 연산에 최적화된 라이브러리
- https://numpy.org/
- 2005년에 만들어졌으며, 100% 오픈소스입니다!
- 최적화된 C code로 구현되어 있어 엄청나게 좋은 성능을 보입니다
- 파이썬과 다르게 수치 연산의 안정성이 보장되어 있습니다 (numerical stable)
- N차원 실수값 연산에 최적화되어 있습니다 == N개의 실수로 이루어진 벡터 연산에 최적화되어 있습니다
NumPy
Powerful N-dimensional arrays Fast and versatile, the NumPy vectorization, indexing, and broadcasting concepts are the de-facto standards of array computing today. Numerical computing tools NumPy offers comprehensive mathematical functions, random number g
numpy.org
# numpy example
import numpy as np
arr = np.array([1, 2, 3]
print(np.linalg.norm(arr)) # print L2 norm of vector (1, 2, 3)
Numpy를 사용해야 하는 이유:
- 데이터는 벡터로 표현됩니다. 데이터 분석이란 벡터 연산입니다. 그러므로 벡터 연산을 잘해야 데이터 분석을 잘할 수 있습니다
- (native) 파이썬은 수치 연산에 매우 약합니다. 실수값 연산에 오류가 생기면 (numerical error) 원하는 결과를 얻지 못할 수 있습니다. 많은 실수 연산이 요구되는 머신러닝에서 성능 저하로 이어질 수 있습니다
- numpy는 벡터 연산을 빠르게 처리하는 것에 최적화되어 있습니다. 파이썬 리스트로 구현했을 때보다 훨씬 더 높은 속도를 보여줍니다
02. Numpy array:
Numpy array: numpy에서 사용되는 기본적인 자료구조
- numpy array는 C언어의 array 구조와 동일한 개념입니다 (TMI : C array)
- numpy array는 파이썬 리스트와 비슷한 구조입니다. 하지만, 세부적인 특징이 많이 다릅니다
C 언어 코딩 도장: 36.1 배열을 선언하고 요소에 접근하기
배열은 변수 이름 뒤에 [ ] (대괄호)를 붙인 뒤 크기를 설정합니다. 그리고 배열을 선언하면서 값을 초기화할 때는 { } (중괄호)를 사용합니다. 자료형 배열이름[크기]; 자료형 배열이름[크기] = {
dojang.io
< 리스트와 다른 점>
- 선언한 이후에 크기 변경이 불가능합니다
- 모든 원소의 데이터 타입이 동일해야 합니다 (homogeneous array)
< 리스트와 같은 점>
- indexing으로 원소를 접근할 수 있습니다
- 생성 후 assignment operator를 이용해서 원소의 update가 가능합니다
- 수치와 관련된 데이터 타입이 대부분입니다
- 원소의 크기(memory size)를 조절할 수 있으며, 크기에 따라 표현할 수 있는 수치 범위가 정해집니다
e.g. np.int8 → 수치 표현에 8 bits를 사용한다 → 00000000 ~ 11111111 → 2^8 (256개) → -128 ~ 127
e.g. np.float32 → 실수 표현에 32 bits를 사용한다 → exponent, mantissa, sign → 2.813 x 10^23 → single precision
03. Numpy method:
04. Pandas를 사용하는 이유:
Pandas: Python Data Analysis Library. 정형 데이터 분석에 최적화된 라이브러리
Pandas 메인 사이트 URL: https://pandas.pydata.org/
pandas - Python Data Analysis Library
pandas pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now!
pandas.pydata.org
- 2008년에 만들어졌으며, 2009년에 100% 오픈소스가 되었습니다.
- 정형 데이터를 효율적으로 표현할 수 있는 DataFrame 형태로 모든 데이터를 표현합니다.
- 다양한 데이터 조작 기능을 제공합니다.
e.g. indexing(=search), filtering, reshaping, concatenation, reading/writing, … - 벡터 연산에 최적화되어 있습니다 → Numpy와 연관성이 있다!
# pandas example
import pandas as pd
df = pd.DataFrame(np.random.randn(5, 3))
df.head()
Pandas를 사용해야 하는 이유:
- 대부분의 정제된 데이터들은 테이블 형태로 표현됩니다. 이런 테이블 형태의 데이터를 분석하기에 최적의 라이브러리입니다.
- Numpy처럼 정형화된 데이터 연산에 최적화되어 있습니다. 성능이 매우 뛰어납니다!
- 다양한 정형 데이터를 통합 관리할 수 있습니다. e.g. json, html, csv, xlsx, hdf5, sql, … 모두 DataFrame으로 통일해서 표현될 수 있다.
- 엑셀에서 제공하는 연산 기능을 거의 다 제공합니다.
05. Pandas DataFrame:
- DataFrame은 2차원 테이블 구조를 말합니다.
- 1차원 구조인 Series도 있습니다. (1 row, 1 column)
- row, column으로 모든 원소를 구분합니다. (indexing)
- index, columnsm values라는 객체 변수를 가지고 있습니다.
- Relational DB와 완전히 호환됩니다.
- 하나의 column을 기준으로 모든 원소의 data type이 동일합니다. (모두 numpy array가 가지는 data type과 동일)
- DataFrame은 numpy array를 상위 호환하는 개념으로 universal function이 사용 가능합니다.
→ 내부 구현체로 numpy array를 사용하기 때문에 가능!
06. Pandas method:
07. Seaborn을 사용하는 이유:
Seaborn : Statistical Data Visualization library based on matplotlib
Matplotlib:
- 파이썬 오픈소스 라이브러리 중에 가장 널리 사용되는 시각화 라이브러리입니다.
- 2002년부터 만들어졌으며, MATLAB의 기능들을 파이썬으로 가져오는 컨셉으로 시작되었습니다.
- 각종 논문에서 figure를 그릴 때, 사용될 만큼 깔끔하게 그래프를 그려주는 것으로 유명합니다.
- Figure 라는 도화지에 여러가지 component를 얹어서 그래프를 완성하는 컨셉으로 구현됩니다.
- 크게 pyplot 을 이용하여 구현하는 방법과 OOP-style 을 이용하여 구현하는 두 가지 방법이 있습니다.
- 빠르게 적당한 퀄리티의 그래프를 그린다면 pyplot을, 디테일하게 이것저것 표현을 한다면 OOP-style로 구현하는 것을 추천합니다.
Seaborn:
Seaborn 메인 URL 링크: https://seaborn.pydata.org/index.html
seaborn: statistical data visualization — seaborn 0.11.2 documentation
Seaborn is a Python data visualization library based on matplotlib. It provides a high-level interface for drawing attractive and informative statistical graphics. For a brief introduction to the ideas behind the library, you can read the introductory note
seaborn.pydata.org
- 2012년에 만들어졌으며, matplotlib을 더 편하게 사용할 수 있도록 만든 라이브러리입니다.
- matplotlib이 MATLAB을 표방하여 디자인된 것과 다르게, seaborn은 numpy, pandas 같은 파이썬 라이브러리들을 편하게 시각화하는 것을 중점으로 디자인된 라이브러리입니다.
- 특히, DataFrame을 직접적으로 지원하기 때문에 훨씬 편리하게 데이터를 시각화할 수 있습니다.
- 그리고 matplotlib 위에 만들어져서, matplotlib에 있는 개념들을 확장해서 사용할 수 있습니다.
- 다양한 기본 plot들이 있어서 빠르게 통계 분석을 하기에 편리합니다 → EDA
몇 가지 기본 plots:
1. lineplot:
import seaborn as sns
sns.set_theme(style="darkgrid")
# Load an example dataset with long-form data
fmri = sns.load_dataset("fmri")
# Plot the responses for different events and regions
sns.lineplot(x="timepoint", y="signal",
hue="region", style="event",
data=fmri)
2. boxplot:
import seaborn as sns
sns.set_theme(style="ticks", palette="pastel")
# Load the example tips dataset
tips = sns.load_dataset("tips")
# Draw a nested boxplot to show bills by day and time
sns.boxplot(x="day", y="total_bill",
hue="smoker", palette=["m", "g"],
data=tips)
sns.despine(offset=10, trim=True)
3. Joinplot:
import seaborn as sns
sns.set_theme(style="ticks")
# Load the penguins dataset
penguins = sns.load_dataset("penguins")
# Show the joint distribution using kernel density estimation
g = sns.jointplot(
data=penguins,
x="bill_length_mm", y="bill_depth_mm", hue="species",
kind="kde",
)
4. Pairplot:
import seaborn as sns
sns.set_theme(style="ticks")
df = sns.load_dataset("penguins")
sns.pairplot(df, hue="species")
08. pyplot 기초:
09. seaborn plots:
Day 10. 웹크롤링 기본 (파이썬 라이브러리)
1. Pandas:
1. Pandas 소개:
판다스 메인 사이트 URL: https://pandas.pydata.org/
pandas - Python Data Analysis Library
pandas pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now!
pandas.pydata.org
원래는 패널 데이터 라고해서 판다스였음 (사회분야 관련 데이터)
왜 판다스가 데이터 분석 분야에서 메이저하게 쓰이게 되었느냐?
파이썬은 기본적으로 수치계산 분야에서 약한 모습을 보이고 있었음
개발자들은 C++, JAVA를 메이저하게 쓰고 있었는데, 쉬운걸 고민하던 찰나에 귀도 반 로섬씨가 파이썬을 들고 구글에 입사함
파이썬 2점대 중반부터 유명해짐
파이썬의 가장 파워풀한 속성 중 하나인 확장성과 관련해서 라이브러리가 많이 나옴
파이썬으로 누군가 짜 둔 코드를 굉장히 쉽게 가져올 수 있는 환경이 구성됨!!
코딩을 하드하게 배우지 않아도 쉽게 남들이 만들어둔 걸 가져올 수 있음!!
비전공자들도 쉽게 사용할 수 있음! 파이썬 사용자들이 점점 늘어남!!!
다양한 곳에서 사용을 하게 됨 > 오픈소스 라이브러리들이 점점 더 늘어남
파이썬 하나만 공부하면 만들고 싶은 걸 다 만들 수 있는 환경!!
2008년에 처음 만들어진 판다스! 으쌰으쌰해서 데이터 관련 여러가지를 지원함!
우리는 판다스를 테이블 형태의 데이터를 편안하게 다룰 수 있음 (파이썬에서 엑셀을 쓰고 싶다! 하면 판다스)
csv 파일, xlsx 파일 두 가지를 판다스 라이브러리를 통해 읽어 보고 처리하는 것을 오늘 배울 예정!
엑셀 파일을 불러오고 조작해서 쓸 수 있게끔 만드는 것이 오늘의 목표!
판다스 사이트에 가보면 설치 방법도 쉽게 나와있음!
미니콘다로 설치한 사람은 판다스가 설치되어 있지 않으므로 설치부터 진행 예정!
Book: Python for Data Analysis (좋은 책, 한글 번역판도 있음)
진짜 제대로 공부하고 싶다 하면 추천하는 책이 있음
Python data science handbook, Jake Vanderplas 라는 훌륭한 분이 쓰신 책 (900p...ㅇㅅㅇ..)
세 가지 버전으로 소유 가능, 원문(아마존), 번역판, 깃헙 (무료 버전, 주피터로 작성)
https://jakevdp.github.io/PythonDataScienceHandbook/
Python Data Science Handbook | Python Data Science Handbook
This website contains the full text of the Python Data Science Handbook by Jake VanderPlas; the content is available on GitHub in the form of Jupyter notebooks. The text is released under the CC-BY-NC-ND license, and code is released under the MIT license.
jakevdp.github.io
넘파이 재단의 두 가지 대단한점:
1. 공식 도큐먼츠 작성 (아주 좋은 튜토리얼, Getting started 섹션)
- 0.24.2 는 거의 5년전 버전...ㅇㅅㅇ...
- 1.4 버전이 현재 stable 버전
- 구석탱이 어딘가에 cheat sheet 가 있음 (라이브러리마다 거의 다 있음)
- 판다스 도큐가 아주 아주 잘되어있음
- 파이썬 라이브러리 도큐먼트는 Sphinx 로 보통 만듬 (99%)
- 잘 모르겠으면 거의 Documentation 섹션으로 옴
어떤 라이브러리를 학습하든 공식 문서와 친해지도록하자!
우리가 오늘 배울 엑셀 관련 공식문서:
https://pandas.pydata.org/docs/reference/io.html#excel
Input/output — pandas 1.4.4 documentation
Warning One can store a subclass of DataFrame or Series to HDF5, but the type of the subclass is lost upon storing.
pandas.pydata.org
공식 문서 보는 것이 익숙해지는 초보 단계!
중급 레벨로 가면 [ source ] 항목의 실제 구현 코드를 확인!
초고수로가면 문제가 발생할 경우, 제보함! 컨트리뷰터가되는 것!
이 레벨이면 하고 싶은 걸 다 할 수 있음!
오픈소스 생태계는 정말 특별한 구조!!
내가 만든 모든 것을 웹에 무료로 뿌림
AI 분야는 모든 연구자들이 원본 실험코드를 무료로 다 뿌림
이거 신기한데? 싶으면 코드 가져다가 해볼 수 있음
https://github.com/pandas-dev/pandas
GitHub - pandas-dev/pandas: Flexible and powerful data analysis / manipulation library for Python, providing labeled data struct
Flexible and powerful data analysis / manipulation library for Python, providing labeled data structures similar to R data.frame objects, statistical functions, and much more - GitHub - pandas-dev/...
github.com
전 세계 사람들이 다 같이 만들어가고 있는 라이브러리!
한분야의 정점을 찍으면 새로운 걸 만들기 시작함
이런건 왜 없지? 하면서 만들기 시작함..
개발이 정말 재미있고 좋아하면 오픈소스 컨트리뷰터로 최종 진화함
오픈소스와 친숙하고 잘하면 모든 회사에서 좋아함!!
'내가 찾아서 다 해결할 수 있다!'는 것을 잘 보여줄 수 있음!!!
(프로그래밍)언어를 하나 배워야한다면 영어부터 익숙해지자!!
1. Pandas 기초(실습):
1. Pandas DataFrame and Operations
# Pandas 설치
# pandas 라이브러리를 불러옵니다. pd를 약칭으로 사용합니다.
!pip install pandas
>Requirement already satisfied: pandas in /Users/sainthm/opt/anaconda3/envs/sainthm/lib/python3.8/site-packages (1.4.3)
Requirement already satisfied: numpy>=1.18.5 in /Users/sainthm/opt/anaconda3/envs/sainthm/lib/python3.8/site-packages (from pandas) (1.23.2)
Requirement already satisfied: pytz>=2020.1 in /Users/sainthm/opt/anaconda3/envs/sainthm/lib/python3.8/site-packages (from pandas) (2022.2.1)
Requirement already satisfied: python-dateutil>=2.8.1 in /Users/sainthm/opt/anaconda3/envs/sainthm/lib/python3.8/site-packages (from pandas) (2.8.2)
Requirement already satisfied: six>=1.5 in /Users/sainthm/opt/anaconda3/envs/sainthm/lib/python3.8/site-packages (from python-dateutil>=2.8.1->pandas) (1.16.0)
# pandas 불러오기!
import pandas as pd # 이건 외우도록 하자! 99.99% 이렇게 사용!
# 암기가 필요한 데이터분석 4종 세트:
import numpy ad np
import pandas as pd
import matplotlib.pyplt as plt
import seaborn as sns
# pandas 버전 확인!
import pandas as pd
pd.__version__
>'1.4.3' # 1.1.6 버전보다 높으면 무관
- 정형 데이터, Structured Data!
- DataFrame은 2차원 테이블이고, 테이블의 한 줄(행/열)을 Series라고 합니다.
- Series의 모임이 곧, DataFrame이 됩니다.
# s는 1, 3, 5, 6, 8을 원소로 가지는 pandas.Series
pd.Series([1, 3, 5, 6, 8]) # 대문자 S! , 리스트와 비슷하다고 이해하자! # 인덱스와 밸류로 구성
>0 1
1 3
2 5
3 6
4 8
dtype: int64
# 6x4 행렬에 1부터 24까지의 숫자를 원소를 가지고, columns은 순서대로 X1, X2, X3, X4로 하는 DataFrame 생성, 판다스의 근본 데이터프레임!
df = pd.DataFrame(data=[[1, 2, 3, 4],
[5, 6, 7, 8],
[9, 10, 11, 12],
[13, 14, 15, 16],
[17, 18, 19, 20],
[21, 22, 23, 24]],
columns=["X1", "X2", "X3", "X4"])
df
>
X1 X2 X3 X4
0 1 2 3 4
1 5 6 7 8
2 9 10 11 12
3 13 14 15 16
4 17 18 19 20
5 21 22 23 24
# DataFrame은 index, columns, values 세 개로 구성!!
# dataframe index # 함수가 아님
df.index
>RangeIndex(start=0, stop=6, step=1)
# dataframe columns
df.columns
>Index(['X1', 'X2', 'X3', 'X4'], dtype='object')
# dataframe values
df.values
>array([[ 1, 2, 3, 4],
[ 5, 6, 7, 8],
[ 9, 10, 11, 12],
[13, 14, 15, 16],
[17, 18, 19, 20],
[21, 22, 23, 24]])
# 특정 column을 가져오기
df["X1"] # pd.series
>0 1
1 5
2 9
3 13
4 17
5 21
Name: X1, dtype: int64
# X1 column에 2 더하기
df["X1"] + 2 # broadcasting 가능!, 문자열이라면 문자열 concat도 가능!
>0 3
1 7
2 11
3 15
4 19
5 23
Name: X1, dtype: int64
2. DataFrame 기초 method:
method: 방법!, 컴퓨터에서는 특별한 의미가 있음 > 함수!!, full name은 class method, class method나 함수나 개념적으로는 같음!
# dataframe의 맨 위 다섯줄을 보여주는 head()
df.head() # 위에서부터 다섯 줄 출력!
>
X1 X2 X3 X4
0 1 2 3 4
1 5 6 7 8
2 9 10 11 12
3 13 14 15 16
4 17 18 19 20
df.head(3) # 위에서부터 세 줄 출력!
>
X1 X2 X3 X4
0 1 2 3 4
1 5 6 7 8
2 9 10 11 12
# 자매품으로 밑에서부터 보는 tail!
df.tail(2)
>
X1 X2 X3 X4
4 17 18 19 20
5 21 22 23 24
# dataframe에 대한 전체적인 요약정보를 보여줍니다. index, columns, null/not-null/dtype/memory usage가 표시됩니다.
df.info()
# NULL > 컴퓨터의 '없음' 표시
# non-null: 없지 않음, 해당 데이터에 비어있지 않는 데이터의 수, 빈 칸이 몇개나 있는지에대한 정보
><class 'pandas.core.frame.DataFrame'>
RangeIndex: 6 entries, 0 to 5
Data columns (total 4 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 X1 6 non-null int64
1 X2 6 non-null int64
2 X3 6 non-null int64
3 X4 6 non-null int64
dtypes: int64(4)
memory usage: 320.0 bytes # 메인 메모리!!!! # 넘치면 안돌아감!!!! # 죽어버림, 터짐
# dataframe에 대한 전체적인 통계정보를 보여줍니다.
df.describe()
>
X1 X2 X3 X4
count 6.000000 6.000000 6.000000 6.000000
mean 11.000000 12.000000 13.000000 14.000000
std 7.483315 7.483315 7.483315 7.483315
min 1.000000 2.000000 3.000000 4.000000
25% 6.000000 7.000000 8.000000 9.000000
50% 11.000000 12.000000 13.000000 14.000000
75% 16.000000 17.000000 18.000000 19.000000
max 21.000000 22.000000 23.000000 24.000000
# X2 column를 기준으로 오름차순 정렬
# 정렬 시, 줄 전체가 다 바뀜!!!
df.sort_values(by="X2") # 특정 컬럼을 기준으로 정렬
>
X1 X2 X3 X4
0 1 2 3 4
1 5 6 7 8
2 9 10 11 12
3 13 14 15 16
4 17 18 19 20
5 21 22 23 24
# 내림차순으로 정렬
# index도 해당 row의 데이터!!!
df.sort_values(by="X2", ascending=False) # 내림차순으로 정렬
>
X1 X2 X3 X4
5 21 22 23 24
4 17 18 19 20
3 13 14 15 16
2 9 10 11 12
1 5 6 7 8
0 1 2 3 4
3. DataFrame으로 데이터 불러오기:
# csv 파일 불러오기
data = pd.read_csv('data/kospi2022.csv') # 엄청 나게 자주 쓸 read_csv 함수!
data
>
date price
0 2022-01-03 2988.77
1 2022-01-04 2989.24
2 2022-01-05 2953.97
3 2022-01-06 2920.53
4 2022-01-07 2954.89
... ... ...
161 2022-08-29 2426.89
162 2022-08-30 2450.93
163 2022-08-31 2472.05
164 2022-09-01 2415.61
165 2022-09-02 2409.41
166 rows × 2 columns
# Q. 올해 코스피가 2000 이하로 떨어진 날이 언제일까?
data["price"] <= 2000 # boolean mask - filtering
>0 False
1 False
2 False
3 False
4 False
... # 중간에 ... 을 보는 방법, pd.options.display.max_rows = 1000 (1000줄 까지 보고 싶어!, default는 30 정도)
161 False
162 False
163 False
164 False
165 False
Name: price, Length: 166, dtype: bool
# Q. 올해 코스피가 2000 이하로 떨어진 날이 언제일까?
data[data["price"] <= 2000]
>(없다)
date price
# Q. 올해 코스피가 2500 이하로 떨어진 날이 언제일까?
data[data["price"] <= 2500]
>
date price
108 2022-06-14 2492.97
109 2022-06-15 2447.38
110 2022-06-16 2451.41
111 2022-06-17 2440.93
112 2022-06-20 2391.03
113 2022-06-21 2408.93
114 2022-06-22 2342.81
115 2022-06-23 2314.32
116 2022-06-24 2366.60
117 2022-06-27 2401.92
118 2022-06-28 2422.09
119 2022-06-29 2377.99
120 2022-06-30 2332.64
121 2022-07-01 2305.42
122 2022-07-04 2300.34
123 2022-07-05 2341.78
124 2022-07-06 2292.01
125 2022-07-07 2334.27
126 2022-07-08 2350.61
127 2022-07-11 2340.27
128 2022-07-12 2317.76
129 2022-07-13 2328.61
130 2022-07-14 2322.32
131 2022-07-15 2330.98
132 2022-07-18 2375.25
133 2022-07-19 2370.97
134 2022-07-20 2386.85
135 2022-07-21 2409.16
136 2022-07-22 2393.14
137 2022-07-25 2403.69
138 2022-07-26 2412.96
139 2022-07-27 2415.53
140 2022-07-28 2435.27
141 2022-07-29 2451.50
142 2022-08-01 2452.25
143 2022-08-02 2439.62
144 2022-08-03 2461.45
145 2022-08-04 2473.11
146 2022-08-05 2490.80
147 2022-08-08 2493.10
149 2022-08-10 2480.88
155 2022-08-19 2492.69
156 2022-08-22 2462.50
157 2022-08-23 2435.34
158 2022-08-24 2447.45
159 2022-08-25 2477.26
160 2022-08-26 2481.03
161 2022-08-29 2426.89
162 2022-08-30 2450.93
163 2022-08-31 2472.05
164 2022-09-01 2415.61
165 2022-09-02 2409.41
# 날짜 관련 데이터를 확인해보자!
data["date"]
>0 2022-01-03
1 2022-01-04
2 2022-01-05
3 2022-01-06
4 2022-01-07
...
161 2022-08-29
162 2022-08-30
163 2022-08-31
164 2022-09-01
165 2022-09-02
Name: date, Length: 166, dtype: object
# 조건에 따라 데이터를 불러오는 방법: Fancy Indexing!!!
# Q2. kospi2022.csv 파일에서 2022-6월 이전의 데이터만 볼 수 있을까?
data[data["date"] < "2022-06-01"]
>
date price
0 2022-01-03 2988.77
1 2022-01-04 2989.24
2 2022-01-05 2953.97
3 2022-01-06 2920.53
4 2022-01-07 2954.89
... ... ...
96 2022-05-25 2617.22
97 2022-05-26 2612.45
98 2022-05-27 2638.05
99 2022-05-30 2669.66
100 2022-05-31 2685.90
101 rows × 2 columns
# 엑셀 파일 불러오기
data = pd.read_excel('data/2020_02_거래내역.xls')
data
>
이용일시 승인번호 본인구분 브랜드 이용카드 가맹점명 이용금액 이용구분 매입상태 카테고리
0 2020/02/28 12:14 14073061 본 비자 706 쿠팡 2900 일시불 전표매입 쇼핑
1 2020/02/27 08:41 3311645 본 비자 706 (주) 에이스타커피컴퍼니 5100 일시불 전표매입 커피
2 2020/02/26 22:35 1777639 본 비자 706 (주)우아한형제들 17400 일시불(A) 전표매입 야식
3 2020/02/25 18:48 40090458 본 비자 706 하노이별 서강대점 8000 일시불 전표매입 식비
4 2020/02/25 10:02 33240961 본 비자 706 (주) 에이스타커피컴퍼니 5100 일시불 전표매입 커피
... ... ... ... ... ... ... ... ... ... ...
56 2020/02/02 14:06 6544316 본 비자 706 에어프랑스한국지점-BSP 991100 03개월 전표매입 여행
57 2020/02/01 22:21 2751583 본 비자 706 씨유 서강대학사점 3500 일시불 전표매입 식비
58 2020/02/01 18:57 905431 본 비자 706 스타벅스커피코리아 50000 일시불 전표매입 커피
59 2020/02/01 18:44 773794 본 비자 706 개미집 22000 일시불 전표매입 식비
60 2020/02/01 11:04 45363052 본 비자 706 대학약국 6000 일시불 전표매입 생필품
61 rows × 10 columns
# 엑셀 파일 불러오기
data = pd.read_excel('data/LG전자_(2021.07.01_2021.07.08).xlsx')
data
>years company title contents link
0 2021.07.07. 연합뉴스 LG전자 '가전끌고, TV 밀고'…2분기 영업이익 12년 만 최대(종합2보) 2분기 연속 1조원 돌파…매출도 2분기 사상 최대 기록모바일 철수 등 사업재편 효과... https://news.naver.com/main/read.nhn?mode=LSD&...
1 2021.07.07. 매경닷컴 "뉴스에 팔아라?"…LG전자 12년만에 최고 영업익…주가 2.9%↓ [사진 = 연합뉴스] LG전자가 1조원이 넘는 영업이익을 올리며 2분기 기준으로 1... https://news.naver.com/main/read.nhn?mode=LSD&...
2 2021.07.07. 조선일보 삼성, LG 나란히 ‘어닝 서프라이즈' 삼성전자 2분기 영업이익 12.5조삼성전자\t\t\t\t\t\t\t\t\t\t삼성전... https://news.naver.com/main/read.nhn?mode=LSD&...
3 2021.07.07. 뉴시스 LG전자 2분기 연속 1조 돌파…'가전·TV' 효자 노릇(종합) 매출액 17조1101억 원 '역대 최대', 영업이익 1조1128억 원올레드TV 판매... https://news.naver.com/main/read.nhn?mode=LSD&...
4 2021.07.08. donga.com LG전자, 영업익 2개 분기 연속 1조원대… 美월풀 격차 더 벌려 매출 17조… 2분기 역대 최대생활가전부문 매출만 6조원대1위경쟁 월풀보다 1조이상... https://news.naver.com/main/read.nhn?mode=LSD&...
5 2021.07.08. 더팩트 LG전자, '대학생 16명'과 고객 인사이트 찾는다 LG전자가 Z세대(1990년대 중반에서 2000년대 초반에 태어난 세대) 대학생을 ... https://news.naver.com/main/read.nhn?mode=LSD&...
6 2021.07.07. 더팩트 LG전자, 시스템 에어컨 전용 가상 쇼룸 오픈 "차별화된 경험 제공" LG전자가 고객의 공조솔루션 이해도를 높이기 위해 가상 쇼룸을 만들었다. /LG전자... https://news.naver.com/main/read.nhn?mode=LSD&...
7 2021.07.07. 한경닷컴 LG전자, 영업이익 2분기 연속 1조 돌파…'실적 신기록' 계속된다 매출은 17조…48% 늘어올 연간 최대실적 갈아치울 듯생활가전 매출만 6조 넘는 듯... https://news.naver.com/main/read.nhn?mode=LSD&...
8 2021.07.07. 서울경제 [속보]LG전자, 2분기 영업이익 1조1,128억원···전년比 65.5%↑ 서울 영등포구 여의도에 위치한 LG 트윈타워 /사진제공=LG전자[서울경제] LG전자... https://news.naver.com/main/read.nhn?mode=LSD&...
9 2021.07.08. inews24.com LG전자, 미래 고객 발굴 위해 Z세대 대학생과 머리 맞댄다 올해 첫 '디자인크루' 프로그램 운영…디자인경영센터 임직원과 콘텐츠 완성LG전자가 ... https://news.naver.com/main/read.nhn?mode=LSD&...
10 2021.07.07. 연합뉴스 LG전자, 시스템 에어컨 전용 3차원 가상 전시장 열어 LG전자 시스템에어컨 전용 3차원 가상 전시장[LG전자 제공. DB 및 재판매 금지... https://news.naver.com/main/read.nhn?mode=LSD&...
11 2021.07.07. 조선일보 삼성, LG 나란히 ‘어닝 서프라이즈' 삼성전자 2분기 영업이익 12.5조삼성전자\t\t\t\t\t\t\t\t\t\t삼성전... https://news.naver.com/main/read.nhn?mode=LSD&...
12 2021.07.06. 뉴시스 LG전자, 올해 미국·호주 등 11개 국가에 클라우드 콜센터 도입 미국법인에 클라우드 콜센터 도입 이어 연내 10개 국가에 확대코로나와 같은 팬데믹 ... https://news.naver.com/main/read.nhn?mode=LSD&...
13 2021.07.07. 뉴시스 LG전자 2분기 최대 실적....증권가 "주가 실적 따라 오를 것" LG전자 시스템 에어컨 전용 가상 쇼룸[서울=뉴시스] 이정필 기자 = LG전자가 올... https://news.naver.com/main/read.nhn?mode=LSD&...
14 2021.07.07. SBS & SBSi LG전자 2분기 영업이익 1조 원 돌파…12년만 최대 LG전자가 가전과 TV 부문의 판매 호조에 힘입어 1조 원이 넘는 영업이익을 올리며... https://news.naver.com/main/read.nhn?mode=LSD&...
15 2021.07.07. media KHAN '깜짝 실적' 올린 삼성·LG전자···주가는 하락 [경향신문] 삼성전자와 LG전자가 올해 2분기 ‘깜짝 실적’을 올렸지만 주가는 모두... https://news.naver.com/main/read.nhn?mode=LSD&...
16 2021.07.07. 뉴시스 반도체 끌고, TV밀고…삼성·LG전자 2분기도 호실적 낸다 삼성전자, 2분기 영업익 11조 돌파 유력LG전자, 2개 분기 연속 1조 영업익 달... https://news.naver.com/main/read.nhn?mode=LSD&...
17 2021.07.07. 뉴시스 LG전자, '역대 2분기 최대 성적' [서울=뉴시스] 김병문 기자 = LG전자가 2분기에 연결기준 매출액 17조 110... https://news.naver.com/main/read.nhn?mode=LSD&...
18 2021.07.07. 뉴시스 LG전자 2분기 잠정 영업익 1.1조 [서울=뉴시스] 김병문 기자 = LG전자가 2분기에 연결기준 매출액 17조 110... https://news.naver.com/main/read.nhn?mode=LSD&...
19 2021.07.06. financial news LG전자, 美 클라우드 콜센터 운영 "국내 도입은 내년 초" [파이낸셜뉴스] LG전자가 미국법인에 클라우드 콜센터를 도입한다고 6일 밝혔다. 회... https://news.naver.com/main/read.nhn?mode=LSD&...
20 2021.07.07. 연합뉴스 삼성 반도체 화려한 부활…휴대폰 접은 LG는 실적 새 역사(종합) 2분기 삼성전자 영업이익 12.5조 깜짝 실적…반도체 7조 육박 전망LG 휴대폰 접... https://news.naver.com/main/read.nhn?mode=LSD&...
21 2021.07.08. edaily LG전자, 아쉬운 2분기…3Q 자동차부품 흑자전환 기대-키움 [이데일리 조용석 기자] 키움증권은 8일 LG전자(066570)의 2분기 실적에 대... https://news.naver.com/main/read.nhn?mode=LSD&...
22 2021.07.08. edaily LG전자, 하반기 車부품 흑자전환에 주가 재평가-SK MC사업부 종료에 향후 분기 평균 영업익 1조원 가능[이데일리 이은정 기자] SK증... https://news.naver.com/main/read.nhn?mode=LSD&...
23 2021.07.08. 연합뉴스 애플 딜레마 빠진 국내 모바일업계…LG '혼돈' 삼성 '긴장' LG, 의사결정 잠정 중단…영세 유통점 반발에 역풍 우려삼성, 의외의 시너지 날까 ... https://news.naver.com/main/read.nhn?mode=LSD&...
24 2021.07.07. 매경닷컴 가전 세계 1위 예약했다…'스마트폰 철수' LG전자 올 사상 최대 실적 기대 가전 세계 1위 등극 기대감 LG전자가 올해 최초로 연간 매출액 70조원과 영업이익... https://news.naver.com/main/read.nhn?mode=LSD&...
25 2021.07.07. 연합뉴스 '사업종료' LG전자 모바일, 2분기 실적 중단영업손실 처리 7월말 생산·판매 종료…LG전자는 사업재편 효과로 최대 실적[연합뉴스 자료사진] ... https://news.naver.com/main/read.nhn?mode=LSD&...
26 2021.07.06. 뉴시스 삼성·LG·위니아딤채 가전3사, 자연재난시 무상수리 지원 [서울=뉴시스] 지난해 8월 집중호우 기간 중 삼성전자서비스 엔지니어들이 수해 피해... https://news.naver.com/main/read.nhn?mode=LSD&...
27 2021.07.08. 조선비즈 [단독] LG화학 ‘분리막 개발팀' 만든다... 6년만에 시장 재진출 전기차 배터리 소재 총괄하는 첨단소재사업본부에 신설 LG화학(051910)이 사내 ... https://news.naver.com/main/read.nhn?mode=LSD&...
28 2021.07.07. 뉴스1 LG전자, 시스템 에어컨 전용 가상 쇼룸 오픈 (서울=뉴스1) = LG전자가 글로벌 고객을 위한 시스템 에어컨 전용 가상 쇼룸을 ... https://news.naver.com/main/read.nhn?mode=LSD&...
29 2021.07.08. 아시아경제신문 [종목속으로] LG전자의 호실적, 커진 기대감 LG전자가 올해 2분기 12년 만에 역대 최대 2분기 실적을 기록함에 따라 투자자들... https://news.naver.com/main/read.nhn?mode=LSD&...
30 2021.07.08. 머니S 삼성·LG, 역대급 실적에도 주가 '무덤덤'… "내년 1분기에 달렸다" 삼성전자와 LG전자가 올해 2분기 어닝 서프라이즈를 기록했음에도 주가는 파란불이 켜... https://news.naver.com/main/read.nhn?mode=LSD&...
31 2021.07.07. edaily [속보]LG전자, 2Q 영업익 1.1조…사상 첫 2분기 연속 1조 [이데일리 신중섭 기자] LG전자(066570)는 7일 잠정 실적 발표를 통해 2분... https://news.naver.com/main/read.nhn?mode=LSD&...
32 2021.07.07. SBS Biz LG전자 가전·TV로 날았다…사상 처음 분기 연속 1조원대 영업익 [앵커]LG전자가 최대 실적 행진을 이어갔습니다.전통 강자인 가전과 TV가 이번에도... https://news.naver.com/main/read.nhn?mode=LSD&...
33 2021.07.06. 매경닷컴 가전 끌고 전장 밀고…LG전자 '20만 전자' 가나 車부품사 LG마그나 출범에2분기 가전 깜짝실적 전망주가 14만원대로 조정받은후한달새... https://news.naver.com/main/read.nhn?mode=LSD&...
34 2021.07.08. edaily LG전자, 가전·TV 호실적 지속…턴어라운드 기대감도 유효 -삼성 [이데일리 조해영 기자] 삼성증권은 8일 LG전자(066570)에 대해 가전과 TV... https://news.naver.com/main/read.nhn?mode=LSD&...
35 2021.07.07. 매일신문 삼성전자 2분기 영업이익 12조…LG는 1조1천억대 '깜짝 실적' 두 기업 영업익 역대 2분기 최고 기록 새로 썼다삼성, D램·낸드플래시 메모리 가격... https://news.naver.com/main/read.nhn?mode=LSD&...
36 2021.07.08. 조선비즈 전기차 모든 부품 다 만든다…구광모의 LG, 미래車에 사활 구광모 프로젝트 ‘車 전장 전환’ 막바지 단계그룹 내 주요 계열사 부품 또는 전장 ... https://news.naver.com/main/read.nhn?mode=LSD&...
37 2021.07.07. 뉴스1 LG전자 부스 살펴보는 관람객들 (고양=뉴스1) 임세영 기자 = 7일 경기 고양시 킨텍스에서 열린 나노코리아 202... https://news.naver.com/main/read.nhn?mode=LSD&...
38 2021.07.07. media KHAN 반도체 호황에 가전 수요…삼성·LG전자 2분기 실적 축포 [경향신문] 경향신문 자료사진세계 반도체 시장이 3년만에 호황기에 접어들면서 삼성전... https://news.naver.com/main/read.nhn?mode=LSD&...
# 크롤러 데이터 중, 특정 데이터 확인
data['link'][0]
>'https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=101&oid=001&aid=0012509752'
# 특정 컬럼 삭제 방법
# 원본 데이터는 유지됨
data.drop(columns='link')
>
years company title contents
0 2021.07.07. 연합뉴스 LG전자 '가전끌고, TV 밀고'…2분기 영업이익 12년 만 최대(종합2보) 2분기 연속 1조원 돌파…매출도 2분기 사상 최대 기록모바일 철수 등 사업재편 효과...
1 2021.07.07. 매경닷컴 "뉴스에 팔아라?"…LG전자 12년만에 최고 영업익…주가 2.9%↓ [사진 = 연합뉴스] LG전자가 1조원이 넘는 영업이익을 올리며 2분기 기준으로 1...
2 2021.07.07. 조선일보 삼성, LG 나란히 ‘어닝 서프라이즈' 삼성전자 2분기 영업이익 12.5조삼성전자\t\t\t\t\t\t\t\t\t\t삼성전...
3 2021.07.07. 뉴시스 LG전자 2분기 연속 1조 돌파…'가전·TV' 효자 노릇(종합) 매출액 17조1101억 원 '역대 최대', 영업이익 1조1128억 원올레드TV 판매...
4 2021.07.08. donga.com LG전자, 영업익 2개 분기 연속 1조원대… 美월풀 격차 더 벌려 매출 17조… 2분기 역대 최대생활가전부문 매출만 6조원대1위경쟁 월풀보다 1조이상...
5 2021.07.08. 더팩트 LG전자, '대학생 16명'과 고객 인사이트 찾는다 LG전자가 Z세대(1990년대 중반에서 2000년대 초반에 태어난 세대) 대학생을 ...
6 2021.07.07. 더팩트 LG전자, 시스템 에어컨 전용 가상 쇼룸 오픈 "차별화된 경험 제공" LG전자가 고객의 공조솔루션 이해도를 높이기 위해 가상 쇼룸을 만들었다. /LG전자...
7 2021.07.07. 한경닷컴 LG전자, 영업이익 2분기 연속 1조 돌파…'실적 신기록' 계속된다 매출은 17조…48% 늘어올 연간 최대실적 갈아치울 듯생활가전 매출만 6조 넘는 듯...
8 2021.07.07. 서울경제 [속보]LG전자, 2분기 영업이익 1조1,128억원···전년比 65.5%↑ 서울 영등포구 여의도에 위치한 LG 트윈타워 /사진제공=LG전자[서울경제] LG전자...
9 2021.07.08. inews24.com LG전자, 미래 고객 발굴 위해 Z세대 대학생과 머리 맞댄다 올해 첫 '디자인크루' 프로그램 운영…디자인경영센터 임직원과 콘텐츠 완성LG전자가 ...
10 2021.07.07. 연합뉴스 LG전자, 시스템 에어컨 전용 3차원 가상 전시장 열어 LG전자 시스템에어컨 전용 3차원 가상 전시장[LG전자 제공. DB 및 재판매 금지...
11 2021.07.07. 조선일보 삼성, LG 나란히 ‘어닝 서프라이즈' 삼성전자 2분기 영업이익 12.5조삼성전자\t\t\t\t\t\t\t\t\t\t삼성전...
12 2021.07.06. 뉴시스 LG전자, 올해 미국·호주 등 11개 국가에 클라우드 콜센터 도입 미국법인에 클라우드 콜센터 도입 이어 연내 10개 국가에 확대코로나와 같은 팬데믹 ...
13 2021.07.07. 뉴시스 LG전자 2분기 최대 실적....증권가 "주가 실적 따라 오를 것" LG전자 시스템 에어컨 전용 가상 쇼룸[서울=뉴시스] 이정필 기자 = LG전자가 올...
14 2021.07.07. SBS & SBSi LG전자 2분기 영업이익 1조 원 돌파…12년만 최대 LG전자가 가전과 TV 부문의 판매 호조에 힘입어 1조 원이 넘는 영업이익을 올리며...
15 2021.07.07. media KHAN '깜짝 실적' 올린 삼성·LG전자···주가는 하락 [경향신문] 삼성전자와 LG전자가 올해 2분기 ‘깜짝 실적’을 올렸지만 주가는 모두...
16 2021.07.07. 뉴시스 반도체 끌고, TV밀고…삼성·LG전자 2분기도 호실적 낸다 삼성전자, 2분기 영업익 11조 돌파 유력LG전자, 2개 분기 연속 1조 영업익 달...
17 2021.07.07. 뉴시스 LG전자, '역대 2분기 최대 성적' [서울=뉴시스] 김병문 기자 = LG전자가 2분기에 연결기준 매출액 17조 110...
18 2021.07.07. 뉴시스 LG전자 2분기 잠정 영업익 1.1조 [서울=뉴시스] 김병문 기자 = LG전자가 2분기에 연결기준 매출액 17조 110...
19 2021.07.06. financial news LG전자, 美 클라우드 콜센터 운영 "국내 도입은 내년 초" [파이낸셜뉴스] LG전자가 미국법인에 클라우드 콜센터를 도입한다고 6일 밝혔다. 회...
20 2021.07.07. 연합뉴스 삼성 반도체 화려한 부활…휴대폰 접은 LG는 실적 새 역사(종합) 2분기 삼성전자 영업이익 12.5조 깜짝 실적…반도체 7조 육박 전망LG 휴대폰 접...
21 2021.07.08. edaily LG전자, 아쉬운 2분기…3Q 자동차부품 흑자전환 기대-키움 [이데일리 조용석 기자] 키움증권은 8일 LG전자(066570)의 2분기 실적에 대...
22 2021.07.08. edaily LG전자, 하반기 車부품 흑자전환에 주가 재평가-SK MC사업부 종료에 향후 분기 평균 영업익 1조원 가능[이데일리 이은정 기자] SK증...
23 2021.07.08. 연합뉴스 애플 딜레마 빠진 국내 모바일업계…LG '혼돈' 삼성 '긴장' LG, 의사결정 잠정 중단…영세 유통점 반발에 역풍 우려삼성, 의외의 시너지 날까 ...
24 2021.07.07. 매경닷컴 가전 세계 1위 예약했다…'스마트폰 철수' LG전자 올 사상 최대 실적 기대 가전 세계 1위 등극 기대감 LG전자가 올해 최초로 연간 매출액 70조원과 영업이익...
25 2021.07.07. 연합뉴스 '사업종료' LG전자 모바일, 2분기 실적 중단영업손실 처리 7월말 생산·판매 종료…LG전자는 사업재편 효과로 최대 실적[연합뉴스 자료사진] ...
26 2021.07.06. 뉴시스 삼성·LG·위니아딤채 가전3사, 자연재난시 무상수리 지원 [서울=뉴시스] 지난해 8월 집중호우 기간 중 삼성전자서비스 엔지니어들이 수해 피해...
27 2021.07.08. 조선비즈 [단독] LG화학 ‘분리막 개발팀' 만든다... 6년만에 시장 재진출 전기차 배터리 소재 총괄하는 첨단소재사업본부에 신설 LG화학(051910)이 사내 ...
28 2021.07.07. 뉴스1 LG전자, 시스템 에어컨 전용 가상 쇼룸 오픈 (서울=뉴스1) = LG전자가 글로벌 고객을 위한 시스템 에어컨 전용 가상 쇼룸을 ...
29 2021.07.08. 아시아경제신문 [종목속으로] LG전자의 호실적, 커진 기대감 LG전자가 올해 2분기 12년 만에 역대 최대 2분기 실적을 기록함에 따라 투자자들...
30 2021.07.08. 머니S 삼성·LG, 역대급 실적에도 주가 '무덤덤'… "내년 1분기에 달렸다" 삼성전자와 LG전자가 올해 2분기 어닝 서프라이즈를 기록했음에도 주가는 파란불이 켜...
31 2021.07.07. edaily [속보]LG전자, 2Q 영업익 1.1조…사상 첫 2분기 연속 1조 [이데일리 신중섭 기자] LG전자(066570)는 7일 잠정 실적 발표를 통해 2분...
32 2021.07.07. SBS Biz LG전자 가전·TV로 날았다…사상 처음 분기 연속 1조원대 영업익 [앵커]LG전자가 최대 실적 행진을 이어갔습니다.전통 강자인 가전과 TV가 이번에도...
33 2021.07.06. 매경닷컴 가전 끌고 전장 밀고…LG전자 '20만 전자' 가나 車부품사 LG마그나 출범에2분기 가전 깜짝실적 전망주가 14만원대로 조정받은후한달새...
34 2021.07.08. edaily LG전자, 가전·TV 호실적 지속…턴어라운드 기대감도 유효 -삼성 [이데일리 조해영 기자] 삼성증권은 8일 LG전자(066570)에 대해 가전과 TV...
35 2021.07.07. 매일신문 삼성전자 2분기 영업이익 12조…LG는 1조1천억대 '깜짝 실적' 두 기업 영업익 역대 2분기 최고 기록 새로 썼다삼성, D램·낸드플래시 메모리 가격...
36 2021.07.08. 조선비즈 전기차 모든 부품 다 만든다…구광모의 LG, 미래車에 사활 구광모 프로젝트 ‘車 전장 전환’ 막바지 단계그룹 내 주요 계열사 부품 또는 전장 ...
37 2021.07.07. 뉴스1 LG전자 부스 살펴보는 관람객들 (고양=뉴스1) 임세영 기자 = 7일 경기 고양시 킨텍스에서 열린 나노코리아 202...
38 2021.07.07. media KHAN 반도체 호황에 가전 수요…삼성·LG전자 2분기 실적 축포 [경향신문] 경향신문 자료사진세계 반도체 시장이 3년만에 호황기에 접어들면서 삼성전...
# 원본 데이터에서 삭제하고 inplace 하고 싶은 경우
data.drop(columns='link', inplace=True)
data
>years company title contents
0 2021.07.07. 연합뉴스 LG전자 '가전끌고, TV 밀고'…2분기 영업이익 12년 만 최대(종합2보) 2분기 연속 1조원 돌파…매출도 2분기 사상 최대 기록모바일 철수 등 사업재편 효과...
1 2021.07.07. 매경닷컴 "뉴스에 팔아라?"…LG전자 12년만에 최고 영업익…주가 2.9%↓ [사진 = 연합뉴스] LG전자가 1조원이 넘는 영업이익을 올리며 2분기 기준으로 1...
2 2021.07.07. 조선일보 삼성, LG 나란히 ‘어닝 서프라이즈' 삼성전자 2분기 영업이익 12.5조삼성전자\t\t\t\t\t\t\t\t\t\t삼성전...
3 2021.07.07. 뉴시스 LG전자 2분기 연속 1조 돌파…'가전·TV' 효자 노릇(종합) 매출액 17조1101억 원 '역대 최대', 영업이익 1조1128억 원올레드TV 판매...
4 2021.07.08. donga.com LG전자, 영업익 2개 분기 연속 1조원대… 美월풀 격차 더 벌려 매출 17조… 2분기 역대 최대생활가전부문 매출만 6조원대1위경쟁 월풀보다 1조이상...
5 2021.07.08. 더팩트 LG전자, '대학생 16명'과 고객 인사이트 찾는다 LG전자가 Z세대(1990년대 중반에서 2000년대 초반에 태어난 세대) 대학생을 ...
6 2021.07.07. 더팩트 LG전자, 시스템 에어컨 전용 가상 쇼룸 오픈 "차별화된 경험 제공" LG전자가 고객의 공조솔루션 이해도를 높이기 위해 가상 쇼룸을 만들었다. /LG전자...
7 2021.07.07. 한경닷컴 LG전자, 영업이익 2분기 연속 1조 돌파…'실적 신기록' 계속된다 매출은 17조…48% 늘어올 연간 최대실적 갈아치울 듯생활가전 매출만 6조 넘는 듯...
8 2021.07.07. 서울경제 [속보]LG전자, 2분기 영업이익 1조1,128억원···전년比 65.5%↑ 서울 영등포구 여의도에 위치한 LG 트윈타워 /사진제공=LG전자[서울경제] LG전자...
9 2021.07.08. inews24.com LG전자, 미래 고객 발굴 위해 Z세대 대학생과 머리 맞댄다 올해 첫 '디자인크루' 프로그램 운영…디자인경영센터 임직원과 콘텐츠 완성LG전자가 ...
10 2021.07.07. 연합뉴스 LG전자, 시스템 에어컨 전용 3차원 가상 전시장 열어 LG전자 시스템에어컨 전용 3차원 가상 전시장[LG전자 제공. DB 및 재판매 금지...
11 2021.07.07. 조선일보 삼성, LG 나란히 ‘어닝 서프라이즈' 삼성전자 2분기 영업이익 12.5조삼성전자\t\t\t\t\t\t\t\t\t\t삼성전...
12 2021.07.06. 뉴시스 LG전자, 올해 미국·호주 등 11개 국가에 클라우드 콜센터 도입 미국법인에 클라우드 콜센터 도입 이어 연내 10개 국가에 확대코로나와 같은 팬데믹 ...
13 2021.07.07. 뉴시스 LG전자 2분기 최대 실적....증권가 "주가 실적 따라 오를 것" LG전자 시스템 에어컨 전용 가상 쇼룸[서울=뉴시스] 이정필 기자 = LG전자가 올...
14 2021.07.07. SBS & SBSi LG전자 2분기 영업이익 1조 원 돌파…12년만 최대 LG전자가 가전과 TV 부문의 판매 호조에 힘입어 1조 원이 넘는 영업이익을 올리며...
15 2021.07.07. media KHAN '깜짝 실적' 올린 삼성·LG전자···주가는 하락 [경향신문] 삼성전자와 LG전자가 올해 2분기 ‘깜짝 실적’을 올렸지만 주가는 모두...
16 2021.07.07. 뉴시스 반도체 끌고, TV밀고…삼성·LG전자 2분기도 호실적 낸다 삼성전자, 2분기 영업익 11조 돌파 유력LG전자, 2개 분기 연속 1조 영업익 달...
17 2021.07.07. 뉴시스 LG전자, '역대 2분기 최대 성적' [서울=뉴시스] 김병문 기자 = LG전자가 2분기에 연결기준 매출액 17조 110...
18 2021.07.07. 뉴시스 LG전자 2분기 잠정 영업익 1.1조 [서울=뉴시스] 김병문 기자 = LG전자가 2분기에 연결기준 매출액 17조 110...
19 2021.07.06. financial news LG전자, 美 클라우드 콜센터 운영 "국내 도입은 내년 초" [파이낸셜뉴스] LG전자가 미국법인에 클라우드 콜센터를 도입한다고 6일 밝혔다. 회...
20 2021.07.07. 연합뉴스 삼성 반도체 화려한 부활…휴대폰 접은 LG는 실적 새 역사(종합) 2분기 삼성전자 영업이익 12.5조 깜짝 실적…반도체 7조 육박 전망LG 휴대폰 접...
21 2021.07.08. edaily LG전자, 아쉬운 2분기…3Q 자동차부품 흑자전환 기대-키움 [이데일리 조용석 기자] 키움증권은 8일 LG전자(066570)의 2분기 실적에 대...
22 2021.07.08. edaily LG전자, 하반기 車부품 흑자전환에 주가 재평가-SK MC사업부 종료에 향후 분기 평균 영업익 1조원 가능[이데일리 이은정 기자] SK증...
23 2021.07.08. 연합뉴스 애플 딜레마 빠진 국내 모바일업계…LG '혼돈' 삼성 '긴장' LG, 의사결정 잠정 중단…영세 유통점 반발에 역풍 우려삼성, 의외의 시너지 날까 ...
24 2021.07.07. 매경닷컴 가전 세계 1위 예약했다…'스마트폰 철수' LG전자 올 사상 최대 실적 기대 가전 세계 1위 등극 기대감 LG전자가 올해 최초로 연간 매출액 70조원과 영업이익...
25 2021.07.07. 연합뉴스 '사업종료' LG전자 모바일, 2분기 실적 중단영업손실 처리 7월말 생산·판매 종료…LG전자는 사업재편 효과로 최대 실적[연합뉴스 자료사진] ...
26 2021.07.06. 뉴시스 삼성·LG·위니아딤채 가전3사, 자연재난시 무상수리 지원 [서울=뉴시스] 지난해 8월 집중호우 기간 중 삼성전자서비스 엔지니어들이 수해 피해...
27 2021.07.08. 조선비즈 [단독] LG화학 ‘분리막 개발팀' 만든다... 6년만에 시장 재진출 전기차 배터리 소재 총괄하는 첨단소재사업본부에 신설 LG화학(051910)이 사내 ...
28 2021.07.07. 뉴스1 LG전자, 시스템 에어컨 전용 가상 쇼룸 오픈 (서울=뉴스1) = LG전자가 글로벌 고객을 위한 시스템 에어컨 전용 가상 쇼룸을 ...
29 2021.07.08. 아시아경제신문 [종목속으로] LG전자의 호실적, 커진 기대감 LG전자가 올해 2분기 12년 만에 역대 최대 2분기 실적을 기록함에 따라 투자자들...
30 2021.07.08. 머니S 삼성·LG, 역대급 실적에도 주가 '무덤덤'… "내년 1분기에 달렸다" 삼성전자와 LG전자가 올해 2분기 어닝 서프라이즈를 기록했음에도 주가는 파란불이 켜...
31 2021.07.07. edaily [속보]LG전자, 2Q 영업익 1.1조…사상 첫 2분기 연속 1조 [이데일리 신중섭 기자] LG전자(066570)는 7일 잠정 실적 발표를 통해 2분...
32 2021.07.07. SBS Biz LG전자 가전·TV로 날았다…사상 처음 분기 연속 1조원대 영업익 [앵커]LG전자가 최대 실적 행진을 이어갔습니다.전통 강자인 가전과 TV가 이번에도...
33 2021.07.06. 매경닷컴 가전 끌고 전장 밀고…LG전자 '20만 전자' 가나 車부품사 LG마그나 출범에2분기 가전 깜짝실적 전망주가 14만원대로 조정받은후한달새...
34 2021.07.08. edaily LG전자, 가전·TV 호실적 지속…턴어라운드 기대감도 유효 -삼성 [이데일리 조해영 기자] 삼성증권은 8일 LG전자(066570)에 대해 가전과 TV...
35 2021.07.07. 매일신문 삼성전자 2분기 영업이익 12조…LG는 1조1천억대 '깜짝 실적' 두 기업 영업익 역대 2분기 최고 기록 새로 썼다삼성, D램·낸드플래시 메모리 가격...
36 2021.07.08. 조선비즈 전기차 모든 부품 다 만든다…구광모의 LG, 미래車에 사활 구광모 프로젝트 ‘車 전장 전환’ 막바지 단계그룹 내 주요 계열사 부품 또는 전장 ...
37 2021.07.07. 뉴스1 LG전자 부스 살펴보는 관람객들 (고양=뉴스1) 임세영 기자 = 7일 경기 고양시 킨텍스에서 열린 나노코리아 202...
38 2021.07.07. media KHAN 반도체 호황에 가전 수요…삼성·LG전자 2분기 실적 축포 [경향신문] 경향신문 자료사진세계 반도체 시장이 3년만에 호황기에 접어들면서 삼성전...
# 파일 저장 방법
data.to_excel('data/result.xlsx')
!ls ./data
>2020_02_거래내역.xls
2020_03_거래내역.xls
LG전자_(2021.07.01_2021.07.08).xlsx
LG전자_(2022.01.01~2022.06.09).xlsx
kospi2022.csv
result.xlsx
# 파일을 저장할 때, index를 날리고 저장하기!
data.to_excel('data/result2.xlsx', index=False)
!ls ./data
>2020_02_거래내역.xls
2020_03_거래내역.xls
LG전자_(2021.07.01_2021.07.08).xlsx
LG전자_(2022.01.01~2022.06.09).xlsx
kospi2022.csv
result.xlsx
result2.xlsx

긴 글 읽어주셔서 감사합니다 :)
'AI > [부트캠프] 데이터 사이언티스트 과정' 카테고리의 다른 글
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 12. (0) | 2022.09.06 |
---|---|
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 11. (0) | 2022.09.05 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 9. (0) | 2022.09.01 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 8. (0) | 2022.08.31 |
[Megabyte School : AI 데이터 사이언티스트 취업 완성 과정] Day 7. (0) | 2022.08.30 |