작년 2023년 4월 빅데이터분석기사 6회 필기 합격 후미루고 미루던 실기 시험을 치르고 합격했습니다. 배경- 컴퓨터공학과 졸업- 학부시절 인공지능, 머신러닝 과목 수강- 외부 빅데이터 교육 이수- 빅데이터 분석 공모전 (pandas 사용 경험)- 정보처리기사- SQLD 공부 스케줄6/3부터 3주 공부하려고 했는데 역시 회사 다니면서 공부하는 건 쉽지가 않았다... ^^ 시험 1주일 전부터 빡공 했다. 집에선 집중이 잘 안 돼서 퇴근하고 맨날 카페 가서 새벽까지 공부하고 귀가했다... 시험 2주 전 주말에는 작업형 1 공부시험 1주 전 주말에 작업형 2 공부월화는 작업형 3 공부,수, 목, 금은 2회~6회 기출문제를 풀면서 공부했다.시험 전 금요일은 기출 5, 6회 풀고 작업형 3 유형 총정리 했다. ..
대학교 4학년 때 빅데이터 수업을 들으면서 데이터를 다루는 것이 재미있었다. 대외활동으로 분석 공모전을 진행하면서 분석에 활용할 수 있도록 데이터를 수집하고 가공하는 일에 흥미를 가지게 되었다. 현재는 어찌어찌 취업을 해서 웹 개발 업무를 하고 있지만 언젠가는 데이터 엔지니어가 되고 싶다는 목표가 있다. 그래서 빅데이터 분석 기사를 공부해 볼까 하는 생각이 들었다. (빅데이터 공모전 했던 거 + 공빅데 하면서 공부했던 것도 그냥 넘겨버리기 아쉬워서 ㅎㅎ ,,, + 기사 자격증 하나 더 따고 싶은 마음) 내가 과연 지금 자격증 공부를 하는 게 맞나?라는 고민을 계속했지만 지금 와서 보면 그냥 애매하게 시간을 보내는 것보단 훨씬 나은 선택이었다고 생각한다. 고민할 시간에 뭐라도 하자..! 회사를 다니고..
실습 환경 - Google Colab문자열¶In [1]:import pandas as pddf = pd.DataFrame({'A': ['블루베리 스무디', '딸기 스무디', '딸기 바나나 스무디'], 'B': [10, 20, 30], 'C': ['추천/신메뉴', '신메뉴/할인', '사이즈업/추천'], 'D': ['ab cd', 'AB CD', 'ab cd'] })dfOut[1]:ABCD0블루베리 스무디10추천/신메뉴ab cd1딸기 스무디20신메뉴/할인AB CD2딸기 바나나 스무디30사이즈업/추천ab cdIn [4]:# replace : 전체 문자가 일치해야 변경 가능df['A'..
실습 환경 - Google Colab시계열 데이터 (Timedelta)¶두 시점의 차이를 나타냄날짜와 시간을 더하거나 빼서 새로운 시점 이전이나 이후 몇 시간뒤, 며칠 뒤를 계산In [1]:# 데이터 생성(실습 전 실행)import pandas as pddata = { 'Date1': ['2024-02-17', '2024-02-18', '2024-02-19'], 'Date2': ['2024:02:17', '2024:02:18', '2024:02:19'], 'Date3': ['24/02/17', '24/02/18', '24/02/19'], 'Date4': ['02/17/2024', '02/18/2024', '02/19/2024'], 'Date5': ['17-Feb-2024', '..
실습 환경 - Google Colab시계열 데이터 (Datetime)¶In [ ]:# 데이터 생성(실습 전 실행)import pandas as pddata = { 'Date1': ['2024-02-17', '2024-02-18', '2024-02-19'], 'Date2': ['2024:02:17', '2024:02:18', '2024:02:19'], 'Date3': ['24/02/17', '24/02/18', '24/02/19'], 'Date4': ['02/17/2024', '02/18/2024', '02/19/2024'], 'Date5': ['17-Feb-2024', '18-Feb-2024', '19-Feb-2024'], 'Date6': ['2024년02월17일', '2..
실습 환경 - Google Colab자주 활용되는 판다스 예제¶In [47]:# 학습 전 실행: csv파일 (data.csv) 생성import pandas as pdimport numpy as npdata = { "메뉴":['아메리카노','카페라떼','카페모카', '바닐라라떼', '녹차', '초코라떼', '바닐라콜드브루'], "가격":[4100, 4600, 4600, 5100, 4100, 5000, 5100], "할인율":[0.5, 0.1, 0.2, 0.3, 0, 0, 0], "칼로리":[10, 180, 420, 320, 20, 500, 400], "원두":['콜롬비아', np.NaN, '과테말라', np.NaN, '한국', '콜롬비아', np.NaN], "이벤트가":[1..
실습 환경 - Google Colab판다스 기초2¶In [1]:# 학습 전 반드시 실행: csv파일 (data.csv) 생성import pandas as pddata = { "메뉴":['아메리카노','카페라떼','카페모카', '바닐라라떼', '녹차', '초코라떼', '바닐라콜드브루'], "가격":[4100, 4600, 4600, 5100, 4100, 5000, 5100], "할인율":[0.5, 0.1, 0.2, 0.3, 0, 0, 0], "칼로리":[10, 180, 420, 320, 20, 500, 400],}data = pd.DataFrame(data)data.to_csv('data.csv', index=False)In [24]:# 데이터 불러오기df = pd.read_csv('d..
실습 환경 - Google Colab판다스 기초1¶In [2]:# 학습 전 반드시 실행: csv파일 (data.csv) 생성import pandas as pddata = { "메뉴":['아메리카노','카페라떼','카페모카', '바닐라라떼', '녹차', '초코라떼', '바닐라콜드브루'], "가격":[4100, 4600, 4600, 5100, 4100, 5000, 5100], "할인율":[0.5, 0.1, 0.2, 0.3, 0, 0, 0], "칼로리":[10, 180, 420, 320, 20, 500, 400],}data = pd.DataFrame(data)data.to_csv('data.csv', index=False)라이브러리 불러오기¶In [3]:import pandas as pd..