집합(set)은 파이썬 2.3 부터 지원되기 시작한 자료형으로, 집합에 관련된 것들을 쉽게 처리하기 위해 만들어진 자료형이다.
집합 자료형은 다음과 같이 set 키워드 를 이용해 만들 수 있다.
>>> s1=set([1,2,3])
>>> s1
{1, 2, 3}
>>> s2=set("hello")
>>> s2
{'e', 'h', 'l', 'o'}
위와 같이 set() 괄호 안에 리스트를 입력하여 만들거나 문자열을 입력하여 만들 수도 있다.
리스트나 튜플은 순서가 있기(ordered) 때문에 인덱싱을 통해 자료형의 값을 얻을 수 있지만,
set 자료형읜 순서가 없기 때문에(unordered) 인덱싱으로 값을 얻을 수 없다.
이는 마치 딕셔너리와 비슷하낟.
딕셔너리 역시 순서가 없는 자료형이라 인덱싱을 지원하지 않는다.
만약 set 자료형에 저장된 값을 인덱싱으로 접근하려면 다음과 같이 리스트나 튜플로 변환한 후 해야한다.
>>> s1=set([1,2,3])
>>> l1=list(s1)
>>> l1
[1, 2, 3]
>>> l1[0]
1
>>> t1=tuple(s1)
>>> t1
(1, 2, 3)
>>> t1[0]
1
>>> s1=set([1,2,3,4,5,6])
>>> s2=set([4,5,6,7,8,9])
>>> s1&s2
{4, 5, 6}
>>> s1.intersection(s2)
{4, 5, 6}
>>> s1|s2
{1, 2, 3, 4, 5, 6, 7, 8, 9}
>>> s1.union(s2)
{1, 2, 3, 4, 5, 6, 7, 8, 9}
>>> s1-s2
{1, 2, 3}
>>> s2-s1
{8, 9, 7}
>>> s1.difference(s2)
{1, 2, 3}
>>> s2.difference(s1)
{8, 9, 7}
이미 만들어진 set 자료형에 값을 추가할 수 있다. 1개의 값만 추가(add)할 경우에는 아래와 같이 한다.
>>> s1=set([1,2,3])
>>> s1.add(4)
>>> s1
{1, 2, 3, 4}
여러개의 값을 한꺼번에 추가할 때에는 다음과 같이 하면 된다.
>>> s1=set([1,2,3])
>>> s1.update([4,5,6])
>>> s1
{1, 2, 3, 4, 5, 6}
>>> s1.remove(2)
>>> s1
{1, 3, 4, 5, 6}