본문으로 바로가기

[Python] 데이터처리

category Data Science/Python 2015.03.10 17:07

이썬에서 데이터는 두 가지 방법으로 정렬할 수 있습니다.

 

원본 정렬(In-place sorting) : 원래의 데이터를 정렬된 버전으로 변경합니다.

 
>>> data = [631245]
>>> data
[631245]
>>> data.sort()
>>> data
[123456]
 
cs
 

사본 정렬(Copied sorting) : 데이터를 정렬하여 반환 합니다.

 
>>> data = [631245]
>>> data
[631245]
>>> data2 = sorted(data)
>>> data
[631245]
>>> data2
[123456]
 
cs

 

스트의 지능화


1.변환된 데이터를 보관할 리스트를 새로 만들어야 합니다.

2.원래 리스트의 모든 데이터 항목을 나열해야 합니다.

3.나열하면서 각 데이터 항목을 변환해야 합니다.

4.변환된 데이터를 새 리스트에 추가해야 합니다.

 

이러한 작업을 파이썬에서는 간단하게 처리 할 수 있습니다.

 
>>> mins = [123]
>>> secs = [m*60 for m in mins]
>>> secs
[60120180]
>>> lower = ["I""don't""like""spam"]
>>> upper = [s.upper() for s in lower]
>>> upper
['I'"DON'T"'LIKE''SPAM']
 
cs

 

파이썬의 지능형 리스트는 이 언어가 지원하는 함수형 프로그래밍 개념을 지원하는 한 예입니다. 절차적 프로그래밍, 함수형 프로그래밍, 객체 지향 프로그래밍 중 어느 방법이 프로그램을 개발하는 최고의 방법인지에 대해서는 많은 논란이 있지만, 단지 파이썬은 부분적으로나마 이 세 프로그래밍 기법을 지원할 수 있다네요.

 

합을 사용해 중복된 데이터 제거하기


 

파이썬 집합의 무옷보다도 중요한 특징은 집합 안에서의 데이터 항목은 순서가 없고 중복된 데이터를 가질 수 없다는 점입니다.

만약 집합 안에 있는 데이터 항목과 같은 데이터를 추가하려고 하면 파이썬은 그 데이터를 무시합니다.

 
>>> distances = set()
>>> distances
set()
>>> distances = {10.611810.6"two"7}
>>> distances
{'two'810.6117}
 
cs

 

생각중set의 특징

1. 중복을 허용하지 않는다.

2. 순서가 없다. (unordered)

 

고급 sorting : https://wiki.python.org/moin/HowTo/Sorting

 

 

'Data Science > Python' 카테고리의 다른 글

numpy 내장함수  (0) 2016.01.12
[Python] 클래스  (0) 2015.03.11
[Python] 데이터처리  (0) 2015.03.10
[Python] 파일 데이터 저장하기  (0) 2015.02.27
[Python] 파일과 예외  (0) 2015.02.23
[Python] 모듈  (0) 2015.02.16

댓글을 달아 주세요