반응형

Studying/Python 8

[데이터과학/001] 데이터 분석의 기초 - 데이터 수집 · 전처리에 대하여

💻 데이터 과학이란?1. 개념데이터에 근거하여 대상을 탐구하고 문제를 해결하려는 노력 2. 데이터 분석의 과정데이터 수집 → 데이터 전처리 → 데이터 분석 → 시각화💻 데이터 수집1. 데이터 수집 경로데이터 수집경로1차 자료1) 설문조사 : 종이 설문지 / 온라인 설문조사 도구 등 활용2) 내부데이터 활용 : 비식별화1.5차 자료크롤링(스크레핑)- 웹페이지의 데이터 수집- python, AI기반 노코드 크롤링 도구 등 활용2차 자료기존에 모아져 있는 외부데이터 수집- 공공 데이터, 통계청 자료, 패널 데이터 등 공개되어 있는 데이터 아카이브 활용3차 자료기존에 모아져 있고 일부 분석되어 있는 플랫폼을 통해 인사이트를 얻고 추가 데이터 분석 진행2. 데이터 수집2.1 설문지 작성1) 설문번호 포함2) ..

Studying/Python 2025.08.19

[Basic Python] 007. Numpy(3)

1. 단일 객체 저장하기import numpy as np#단일 객체 저장array = np.arange(0,10)np.save('saved.npy', array)#객체 불러오기result = np.load('saved.npy')print(result)[0 1 2 3 4 5 6 7 8 9] 1) 저장저장하려는 객체가 단일 항목일 경우 np.save(file, arr)로 저장합니다. arr는 파일에 저장하려는 numpy의 배열을 말해요.실행을 누르면 해당 위치에 파일이 하나 저장된걸 보실 수 있답니다. 2) 불러오기np.load(file) 함수를 통해 객체를 불러올 수 있습니다.2. 복수 객체 불러오기import numpy as np#배열 생성array1=np.arange(0,10)array2=np.aran..

Studying/Python 2025.08.15

[Basic Python] 006. Numpy(2)

지난번 numpy 라이브러리로 배열에 대한 기초적인 지식을 다지고 배열을 만들어 보았습니다.[Basic Python] 005. numpy (1)오늘은 이 numpy를 통해 연산하는 방법을 공부해보려고 합니다.상수 연산과 배열끼리의 연산은 어떻게 진행되는지 공부해볼까요? 1. numpy 상수 연산import numpy as np#배열 만들기array = np.random.randint(1,10,size=4).reshape(2,2)print(array)#배열에 상수 곱하기result_array = array*10print(result_array)우리가 만든 2*2 배열은 아래와 같습니다.[[4 1] [3 3]]여기에 10씩 곱해준다면, 모든 배열에 10씩 곱해주는 결과가 나옵니다.[[40 10] [30 30..

Studying/Python 2025.08.15

[Basic Python] 005. Numpy (1)

🎈 numpy 이해하기numpy란 무엇일까?다차원 배열을 효과적으로 처리할 수 있도록 도와주는 도구이다. numpy의 차원은 아래와 같이 구성되어 있다.- 1차원 축(행) : axis 0 => Vector- 2차원 축(열) : axis 1 => Matrix(행렬)- 3차원 축(채널) : axis 2 -> Tensor(3차원 이상) 🎈 배열 만들기1. list를 numpy로 변환해보자#list를 numpy로 가져오기import numpy as np # 넘파이 불러오고, 앞으로 np라고 부른다list_data = [1,2,3] array = np.array(list_data) #list_data를 가지고 배열을 생성한다.print(array) print(array.size) #배열의 크기(원소 몇 개인가..

Studying/Python 2025.08.15

[Basic Python] 004. 반복문과 제어 키워드

지난번에 연산자와 조건문을 배워봤습니다.[Basic python] 003. 연산자와 조건문그럼 한 단계 더 나아가 반복문과 제어 키워드에 대해 배워보도록 하겠습니다. ▶️ 반복문1. for 반복문1) 개념for i in [m] : print(i) 반복횟수 n이 데이터의 개수 m과 동일할 때 유리한 반복문입니다. 여기에 우리는 range(n)라는 명령어를 사용하는데요.연속된 int형 데이터를 n개 만들때 사용한답니다.for i in [0,1,2,3,4,5]: print(i)- range(3) : [0,1,2]- range(1,5) : [1,2,3,4] 2) for 반복문 - list 활용하기#for 반복문 + list활용texts = ['가','나','다','라','마']for t in tex..

Studying/Python 2025.08.14

[Basic python] 003. 연산자와 조건문

지난 학습을 통해서 우리는 데이터 입력, 출력, 라이브러리에 대해 배울 수 있었다.[Basic python] 002. 데이터 입출력과 라이브러리그렇다면 이제 연산이나 조건문과 같은 함수를 이용해서 데이터를 사용할 수 있도록 기초를 쌓아보자. 💫 연산자1. 사칙연산자사칙연산자를 표현하는 방법은 아래와 같다+(덧셈) -(뺄셈) *(곱셈) /(나눗셈) %(나머지) //(목) **(거듭제곱)#사칙연산자add = 1+1sub = 5-1mul = 3*3div1 = 8/3 #나누기div2 = 8//3 #몫(소수버림을 가지고 있음)mod = 8%2 #mod 나머지(remainder)구함exp = 3**3print(add, sub, mul, div1, div2, mod, exp)2 4 9 2.666666..

Studying/Python 2025.08.14

[Basic python] 002. 데이터 입출력과 라이브러리

지난 글에서 우리는 파이썬의 기초와 데이터 타입에 대해 공부하였다. [Basic python] 001. 파이썬 기초 및 데이터 타입통계분석을 위해서는 Stata, R, python 등등을 많이 사용한다.그중 python의 Jupyter을 사용하려하며, 이를 위해 파이썬을 기초부터 다져갈 예정이다.혹시 동일한 목적으로 파이썬을 시작하고자 한다면,today-iz.tistory.com그럼 데이터의 입/출력과 라이브러리에 대해 배워볼 차례이다.🖱️데이터 출력1. print(*values, sep=' ', end=)1) print(*values)print( ) 안에 무한대로 변수를 넣을 수 있다는 의미이다.#print(*values)print(1,2,3,4,5,6,7,8)1 2 3 4 5 6 7 8 2) pri..

Studying/Python 2025.08.14

[Basic python] 001. 파이썬 기초 및 데이터 타입

통계분석을 위해서는 Stata, R, python 등등을 많이 사용한다.그중 python의 Jupyter을 사용하려하며, 이를 위해 파이썬을 기초부터 다져갈 예정이다.혹시 동일한 목적으로 파이썬을 시작하고자 한다면, 이 글이 도움이 되길 바란다. 🐰 파이썬 기초1. 숫자, 문자 데이터 출력 - print()print(3)print(3+5)print(3,5,7)print("안녕하세요 파이썬") 2. Comment 주석 달기 - ##comment 주석을 달고 싶다면 이렇게print(3) #우측에도 주석을 달 수 있음#b=5 데이터 옆에 달게 되면, 임시 비활성 용도로 사용할 수 있음 (단축키 ctrl+/) 3. 변수(variables) 사용1) 변수 설정 및 출력#변수설정name = "Spencer"ag..

Studying/Python 2025.08.13
반응형