부스트캠프 week8 특강

Dae Hee Lee·2021년 9월 23일
0

1. 내가 만든 AI, 불법일까 합법일까?

저작권

  • 사람의 생각이나 감정을 표현한 결과물(저작물)에 대하여 창작자에게 주는 권리로 “창작성”이 있다면 별도의 등록절차없이 자연히 발생한다

저작물

  1. 소설ᆞ시ᆞ논문ᆞ강연ᆞ연설ᆞ각본 그 밖의 어문저작물
  2. 음악저작물
  3. 연극 및 무용ᆞ무언극 그 밖의 연극저작물
  4. 회화ᆞ서예ᆞ조각ᆞ판화ᆞ공예ᆞ응용미술저작물 그 밖의 미술저작물 5. 건축물ᆞ건축을 위한 모형 및 설계도서 그 밖의 건축저작물
  5. 사진저작물(이와 유사한 방법으로 제작된 것을 포함한다) 7. 영상저작물
  6. 지도ᆞ도표ᆞ설계도ᆞ약도ᆞ모형 그 밖의 도형저작물
  7. 컴퓨터프로그램저작물

국가에서 발행한 자료(판례 등)나 시사성의 측면에서는 저작권법에 보호받지 못한다.

합법적으로 데이터 사용하기

1. 저작자와 협의

  • 이용 방식에 대해 협의
  • 이용허락, 양도 계약
  • 독점적 이용허락: 저작자는 계약 체결 이용자에게 독점적인 권리를 행사하는 것을 허락함.
  • 비독점적 이용허락: 저작자는 계약을 체결한 이용자 외에도 데이터 이용 계약을 맺을 수 있다.

2. 라이센스

  • 저작자에게 요청을 하지 않아도 특정 조건을 만족하면 이용 가능하도록 만든 저작물 이용허락 규약
  • CCL, 공공누리(국내)

CCL(Creative Commons License)

  • CC-BY
  • CC-BY-ND
  • CC-BY-SA
  • CC-BY-NC
  • CC-BY-NC-ND
  • CC-BY-NC-SA

뉴스 데이터의 이용

뉴스 기사의 저작권은 언론사에 있음

  • 한국언론진흥재단에 문의
  • 조중동은 재단에 소속되지 않아서 따로 문의

0원에 구매한 데이터는 내 마음대로 이용 가능?

  • 판매회원이 정한 이용약관에 따라 다름.

뉴스 기사의 제목은 저작물로서의 가치를 인정받지 못한다.

공정 이용

아래의 경우는 저작권자의 허락을 받지 않고도 저작물을 이용할 수 있다.
1) 교육, 등등
2) 재판절차 등에서의 복제
3) 정치적 연설 등의 이용
4) 학교 교육 목적 등에의 이용
5) 시사보도를위한이용
6) 공표된 저작물의 이용
7) 영리를 목적으로 하지 않은 공연ᆞ방송 8) 사적 이용을 위한 복제
9) 도서관 등에서의 복제
10)시험 문제로서의 복제
11)시각장애인 등을 위한 복제
12)방송사업가의 일시적 녹음ᆞ녹화
13)미술ᆞ사진ᆞ건축저작물의 전시 또는 복제
14)번역 등에 의한 이용
15)시사적인기사및논설의복제
16)프로그램 코드 역분석
17)정당한 이용자에 의한 보존을 위한 프로그램 복제

캐글 그랜드마스터의 노하우 대방출

1.캐글 소개

2010년 설립된 세계에서 가장 유명한 인공지능 대회 플랫폼
2017년 구글에 인수

국내 대회 플랫폼

  1. 카카오 아레나
  2. DACON

캐글을 왜 해야 할까?

  1. 세계적으로 실력을 인정받기 위해서(취업 목적)
    랭킹 시스템, 티어 시스템 활용
  2. AI개발자로 배우고 성장하기 위해서(개인 성장)

2.캐글 시작해보기

1)회원 가입
2)참여할 대회 선택 - 진행중 대회
- Featured : 상업적 목적
- Research : 연구적 목적
- Getting Started&Playground : 초심자 대회
- Analytics : 데이터 분석 노트북 제출
- Recruitment
- General Competition : 리소스 제약 없음
- Code Competition : GPU, CPU 등의 제한
3)대회 데이터 다운로드
4)대회를 위한 파이프라인 구축
5)캐글 notebook을 통해 파이프라인을 빠르게 경험해보기

3. 캐글 노하우 대방출

1) 파이프라인의 빠르고 효율적인 반복
- GPU 장비
- 추천 장비 : RAM 64GB이상, SSD 1TB이상, GPU RTX 2080Ti x 2대(블로워타입 중고)
- 본인만의 기본 코드, 또는 다른 사람의 코드 참고
2) 점수 개선 아이디어
- 캐글 notebook 탭 참고
- Best Score, Most Votes 정렬
- Discussion 탭 참고
- 대회 마지막 제출 때까지 점수 개선 아이디어 생각
3) 탄탄한 검증 전략
- 최종 Private 순위 하락을 피하기 위해서.
캐글 데이터 구성

로컬 CV 점수와 PB 점수가 같이 올라가는 방향을 선택해야함.
4) 기타 꿀팁
앙상블 하기!
대회 종료 1~2주 전까지 싱글 모델 학습을 완료해야함. 50등 이내.
코드 관리 v1, v2, v3 순서로 개별 폴더를 만들어 코드 관리
주피터에서 터미널을 열어서 원격으로 학습 가능!

3. 서비스 향 AI 모델 개발하기

profile
Today is the day

0개의 댓글