⏰SEF2023 - "DAY2.GROW AI와 함께하는 성장" 정리

이하얀·2023년 9월 8일

day2 sef2023

💭 SEF2023

목록 보기

2/3

시간표

1️⃣ AI에 진심인 네이버, 어떻게 다를까?
하정우 / 네이버 클라우드 AI Innovation 센터장

생성형 AI - 인터넷 없이 일하기 힘든 것처럼 AI 없이 일할 수 없을 것
HyperCLOVA X와 우리 AI의 미래
- 초거대 AI → 범용 기술
- 미국 - 무려 80% 이상이 이 AI를 사용한다고 봐야 함
- 사무직 - 엑셀에 AI, GPT4가 붙어서 실적 분석 등을 할 수 있게 됨
- 텍스트 내용을 PPT로 제작 가능 - 교수님들이 좋아하시고, 대학원생들이 더 좋아함 ㅎㅎ
  - AI에게 CSV로 엑셀 파일 업로드해 분석해달라고 하면, 자세한 분석 내용을 다시 질문하여 데이터를 시각화해줌
- 디자이너 - Edge 사이드바에 이미지툴이 존재
  - 글을 잘 넣어주는 것이 중요(프롬프트)
  - 프롬프트 작성조차도 AI에게 맡길 수 있음
- 일상생활 - ChatGPT는 플러그인 제공함
  - 외부 앱을 연결할 수 있음
  - 7월 기준 700개의 앱들이 연결 가능해짐
- 골드만삭스 4월 보고서
  - Generative AI could raise global GDP by 7% 생성형 AI는 세계 GDP를 7%까지 견인 가능하다
- 블룸버그 보고서
  - Generative AI to Become a $1.3 Trillion Market by 2032, Research Finds 2032년까지 1조 3천억 달러 시장이 될 생성 AI
- 초거대 생성 AI를 아이들이 잘 사용할 수 있는 것도 중요함
  - 뉴욕시 공립학교에서 ChatGPT 금지령 해제
초거대 AI 한계점과 사용 전략
- 팩트가 아닌 글을 쓰는 현상
- ChatGPT뿐만 아니라 구글 바드도 마찬가지
- 바드는 한 술 더 뜨기도 ㅎㅎ
- 이런 할루시네이션이 발생하는 이유
  - 단어를 맞추는 형태로 학습했기 때문 + 인공 신경망의 데이터베이스와는 다른 형태의 구조
- 활용 시 주의 점
  - 100점짜리 기대하기 보단 짧은 시간에 초안 작성 시 유용 - 작업 초안을 만드는 정도
  - 구체적 요구사항을 Prompt에 작성
  - 영어로 입력 후 한국어로 번역하는 것이 분량 늘리기에 좋음
    - 학습 내용 자체가 영어가 훨씬 많음
  - 생성한 글에 계속 피드백 하기
  - 본인이 가지고 있는 지식으로 차별화하기
초거대 AI 생태계 중요성
- 글로벌 테그 기업의 클라우드에 모든 정보가 저장됨 → 우리나라의 데이터 주권이 사라지게 될 수 있음
- AI 기술 종속이 자연스레 이뤄질 수 있다는 것
- 한국어 중심의 초거대 생성 AI를 만드는 것이 숙제
- 한국어가 비주류이기 때문에, 영어 문서에 녹아있는 서구의 문화, 가치관, 사고관이 녹아 콘텐츠가 되고 필터 없이 계속 접하게 되기 때문에 우리나라 고유의 가치관이 사라질 수 있음
세계 3번째 초거대 생성 AI
- 네이버가 보유
- 하이퍼클로바 사용 기업이 500개가 넘어감 → 생태계가 이미 형성된 것임
현재 우리나라의 AI 기술력은?
- 영국 Tortoise Media 순위 기준 6위
- 국가 단위의 경쟁 체제로 넘어가고 있음(국제기구 생성)
- 국가 단위에서 초거대 생성 AI의 경쟁력을 갖추는 것이 중요
HyperCLOVA 적용 분야
- 네이버쇼핑에 가장 많이 적용되어 있음
- 클로바노트
- 사회공헌 서비스
  - 클로바 케어콜 서비스
    - 전국 70개 지자체 15,000분의 독거노인 어르신들께 매주 2,3회씩 전화를 걸어 안부를 묻는 서비스
HyperCLOVA X
- 전문 분야 데이터와 같이 학습을 시켜 업무 생산성에 큰 효율을 줄 것임
- 편향성 완화 데이터 셋 활용_법학, 사회과학, 인문학, 철학 교수님들과 함께 데이터 셋 제작
- 더 안전한 AI를 위한 CC-BY-SA 라이선스 - 상업적으로도 사용 가능 https://github.com/naver-ai/korean-safety-benchmarks
- 클라우드 기반 HyperCLOVA X 초거대 AI 서비스 생태계
  - 범용 초거대 AI를 클라우드 기반 API, 기업 자체 보유 데이터 활용 추가학습 기능을 통해 500개 이상 스타트업 활용 중
  - 파트너십을 통해 고객 데이터와 도메인이 특화된 초거대 AI를 API 형태로 파트너만 이용할 수 있도록 제공
초거대 AI 리터러시
- 대학에서 실습 수업 할 수 있도록 진행
- 클라우드 기반 교육 플랫폼 웨일 스페이스와 하이퍼클로바 엑스의 결합으로 효과있는 교육 툴 제공
- 문제 재분할을 위해 각자의 분야에서 전문성이 굉장히 중요해질 예정
- AI에게 일 시키고, 질문하고, 말하는 방법도 배워야 함
- 실제 업무에 적용해보는 것이 중요
강연자
- 임베디드 소프트웨어, 네트워크가 유행하던 시절에 AI를 접함
- 지금 핫한게 반드시 성공한다기 보단, 진짜 내가 하고 싶은 것을 하는 것이 중요
- 내가 10년 후에 어떤게 되고 싶은지, 어떤걸 하고 싶은지를 잘 정해두자
AI는 사람을 대체하진 않을 거다. 하지만 AI를 쓰는 사람들은 쓰지 않는 사람들을 대체하게 될거다

2️⃣ 빌게이츠가 극찬한 미국 칸 아카데미의 GPT
Shawn Jansepar / Khan Academy 엔지니어 디렉터

칸미고
2012년에는 온라인 에듀테크 도구가 상대적으로 적었음
- 칸아카데미→학습을 위한 새로운 온라인 보조 도구로 인기
칸미고의 개발 이유
- ChatGPT는 부정행위에 상당히 많이 사용됨→ 우려 많음
- But.인공지능이 인간의 지능과 잠재력을 향상하는 데 도움을 줄 수 있다고 생각함
- 초반에는 부정적 여론 → 점차 대규모 언어 모델의 잠재력을 십분 활용하고자 살펴보고 장점을 보고자 함
- 벤저민 블룸이 2 시그마 문제 연구에서 제시했던 문제를 해결해 튜터링을 받은 학생들이 성적이 더 좋았음
- GPT 4 등장 후 → 1:1 튜터링 경험을 제공할 수 있는 로드맵을 대폭 가속화할 수 있는 절호의 기회로 보고 칸미고 제작함
칸미고의 비전
- 모든 학생들을 위한 튜터이자 모든 교사를 위한 교육 도우미
- 프로그래밍에도 적용
  - 학생이 풀고자 하는 프로그래밍 문제의 전체 문맥을 칸미고에게 알려주고, 궁금한 점 질문 → 버그 발견 및 수정 알려줌
능동적 학습 가능
해커톤 등을 이용해 빠르게 개발하고, 아이디어를 공유하며 학생들에게 적용함
‘사고 연계’ 프롬프트
- 대규모 언어 모델의 추론 역량을 개선하기 위해 사용하는 접근법
- 질문 초기에 AI에게 ‘이걸 출력하면서 꼼꼼히 따져봐. 학생이 왜 실수를 한걸까’
- 뇌 속에서 하는 생각과 닮아있음
문제점
- 규모와 비용
- 수학 과목에서의 정확성 → 수학 과목에서의 실수는 AI의 가장 큰 문제점
- 팩트 체크
로드맵
- AI 메모리 - 대화로부터 인사이트 도출해 후속 대규모 언어 모델 API 호출에 주입
- AI를 중간자로 한 다중 사용자 활동 - 그룹 튜터링 같은 것
- 목표 설정 및 학습 조언
- 그 외 교육적인 부분

3️⃣ GPT와 사랑에 빠진 대표님이 말하는 Chat AI AskUp 이야기
김성훈 / 업스테이지 대표

ChatGPT의 업스테이지
- 끝말잇기 게임을 하는 굉장히 단순한 기계임
- 업스테이지라는 단어를 입력해 주면 업스테이지는 ai라는 단어를 말함
ChatGPT의 인공지능
- 굉장히 뛰어난 인공지능이 머지않았다고 이야기하고 있음
- 채치피티를 사용하는 이유는 자신보다 잘하기 때문
ChatGPT를 이용한 애플리케이션 개발
- 추가적인 애플리케이션을 만들어볼까 시도를 많이 함
- 세 가지 원칙에 맞게 맞는 것들을 우선순위를 가지고 해보자고 함
- gpt는 틀려도 괜찮은 일들에 사용하는 게 좋겠다고 생각함
아마존의 유저 그룹
- ChatGPT 지식을 너무나 잘 갖고 있는 커뮤니티가 있는데 아마존의 유저 그룹임
- ChatGPT가 논문을 읽고 저자에게 질문을 한다면 어떤 질문을 할 것인지 레퍼런스를 찾아달라고 부탁을 했더니 영어긴 하지만 써줌
- ChatGPT가 논문을 깊게 깊게 이해해서 질문하는 것처럼 굉장히 훌륭한 질문임
글쓰기에 도움이 되는 방법
- 글을 요약해 보고 무엇을 배웠는지 물어봤을 때 하는 게 있을 것임
- 글을 읽고 평가해 달라고 하는 것도 글쓰기에 도움이 될 것임
s급 데이터
- s급은 사용자들이 공개된 영역이어서 질문하기 좀 부끄럽다고 해서 가장 개인적인 공간인 카카오톡에 넣었음
- s급은 비정형 데이터로만 돼 있고 2021년까지만 학습돼 있어서 조금씩 극복하고 있음
- s급과 좋은 친구가 될 수 있을 거라고 생각이 듦
ChatGPT와 AutoGPT
- ChatGPT는 요약만 하고 정보를 알려주는 것임
- 오토 gpt는 플래닝을 본인이 다 하고 실행시키는 것임
ChatGPT의장점
- 사람이 하는 일들을 많이 하게 됨
- ChatGPT를 해볼 수 있는 일은 ChatGPT가 기본적으로 글을 읽고 글을 쓰고 요약하는 일들을 너무너무 잘 함
ai 시대의 직업
- ChatGPT는 잠도 자지 않고 무한 반복해서 결과를 냄
- ai 시대에 가장 배치되기 쉬운 직업은 발전이나 변화가 없는 일임
- 공부를 하거나 작업을 목표로 잡는다면 1년 지나서 같은 일을 하고 있느냐 아니면 계속 발전하는 일이냐에 따라서 힘들 수도 있고 기쁠 수도 있음
쓸데없어 보이는 과목
- 쓸데없어라고 생각하는 과목은 없다고 생각함
- 수업에 와서 배운 거를 채치한테 가서 물어보는 것임
- 숫자를 모르면 계산기를 쓸 수가 없음
ChatGPT로 하는 수업
- 친구를 가장 잘 알고 이해하려면 시간을 많이 보내는 것만으로 충분함
- ChatGPT라는 테크놀로지로 대변되는 새로운 테크놀로지와 바뀌는 삶의 모습에 대해서 탐구를 해보자고 함

4️⃣ 교수님이 직접 들려주는 ChatGPT로 A+ 받는 법
마동훈 / 고려대학교 미디어학부 교수

ChatGPT로 강의를 하고, ChatGPT로 토론을 하고, ChatGPT를 바탕으로 학생들은 에세이 시험 문제를 보는 한 학기를 보냄
위키피디어의 장점
- 위키피디어는 모든 사람들이 누구나 원하면 들어와서 같이 자료를 만들고, 그 자료를 통해서 서로 정보를 교환하도록 만들어진 것이 바로 위키피디어 서비스임
- 위키피디어에 있는 정보가 모두 완벽한 정보인가요? 위키피디어에 있는 정보는 지식은 편견이 없는 정보와 지식인가요? 위키피디어의 내용도 늘 바뀌고 위키피디어에 대한 비판의 목소리도 있음
- ChatGPT는 우리가 어떤 질문을 주기만 하면 그 질문을 더 이상 검색하지 않아도 ChatGPT가 24시간, 1년, 12달 잠도 자지 않고 공부한 방대한 디지털화되어 있는 자료들을 바탕으로 자신이 답을 만들어줌
- ChatGPT는 그냥 없는 존재하지 않는 것으로 치고 우리가 그냥 앞으로 갈 수는 없다는 것이 본인 생각이었음
채치피티의 역할
- 교수는 사회 문제, 자연 현상의 어려운 문제들, 공학적 의학적 문제들을 해결함
- 학생도 문제를 해결해야 함
- 교수도 문제를 해결하고 학생도 문제를 해결하는 게 대학의 본연의 목적임
- ChatGPT는 기존의 미디어, 인간들의 커뮤니케이션을 재매개하는 역할을 함
- ChatGPT는 구술 문화의 특성인 대화, 활자 문화, 대량 활자 문화, 구텐베르그 이후에 생긴 서적 문화의 반영임
ChatGPT의 단점
- ChatGPT는 세상에 있는 모든 정보를 바탕으로 어떤 지식과 정보를 하나로 묶어주는 역할을 함
- ChatGPT는 단점이 있음
- ChatGPT가 이야기하는 정보는 항상 정답이 아님
- ChatGPT는 편향적인 이야기를 함
ChatGPT의 위험성
- ChatGPT는 통계학적, 확률론적 앵무새와 환각의 우려가 있는 지극히 약한 존재임
- ChatGPT는 인류의 역사를 바꿔놓을 획기적인 소프트 테크놀로지라고 이야기함
- ChatGPT는 절대 만능이 아님
ChatGPT의 질문
- ChatGPT가 쓰는 글은 오류가 없어 보임
- 에세이로 질문할 수 있는 질문에는 대개 두 가지 유형이 있음
- 마샬 매클루안의 핫미디움과 쿨미디 개념의 차이에 대해 설명해 보라는 질문은 형식적인 지식을 묻는 질문임
- 두 번째 질문의 경우에 ChatGPT는 굉장히 고전함
ChatGPT의 장점
- ChatGPT가 잘하는 것에 대해서 터득을 하게 됨
- 학생들에게 ChatGPT에 대한 경험을 자유롭게 써달라고 부탁을 함
- 내용들을 잘 정리를 해봤더니 첫째 구문적으로 문법적으로 오류가 없는 글을 만드는데 ChatGPT는 굉장히 능함
- 두 번째, 에세이 혹은 논술에 일반적이고 표준적인 구성의 틀을 만드는 것에 굉장히 익숙함
- 세 번째, 다양한 주장을 굉장히 균형적으로 서술하려고 애를 씀
ChatGPT의 취약점
- ChatGPT가 잘 못하는 것은 특수한 사례를 깊이 있게 토론하는 데 굉장히 약함
- 창의적인 방법으로 새로운 이야기 새로운 담론 제시하는 글쓰기에 굉장히 약함
- 자신의 주장을 분명하게 드러내기에 취약점을 가지고 있음
- ChatGPT를 활용하는 방법들을 정리함
- ChatGPT를 참고로 하는 것은 좋은데 sa를 쓰고 난 이후에는 자신의 주장 혹은 자신의 창의적인 생각, 자신만의 생각이 분명히 드러나 있는지를 다시 한 번 곰곰이 생각해 보자고 함
ChatGPT로 A+ 받는 법
- ChatGPT로 A+받는 법은 새로운 테크놀로지를 활용할 때 윤리적 측면을 반드시 고려해야 함
- 인간보다 앞선 테크놀로지는 없다는 명제가 결코 틀리지 않은 이야기가 될 것임

5️⃣ 데이터 사이언티스트 되고 싶다면? 현직자가 알려줄게!
권시현 / IDT Corporation, 이지영 / 사노피

데이터 사이언티스트의 비전공자 진입
데이터 사이언티스트 권시현 : 비전공자로서 미국에서 데이터 사이언티스트로 일을 하고 있음
- 비전공자로서 데이터 사이언스 분야로 진입하기 위해서 필요한 것들에 대해 이야기하고 있음
- 수학과 통계, 코딩, 학위에 대해 이야기하고 있음
파이썬 프로젝트 연습
- 파이썬 기초를 하나하나 공부하는 것도 좋은 방법이지만, 만약에 여러분들이 그렇게 따라가는데 뭔가 지루함을 느끼고 잘 진도가 안 나간다 싶으면 그 과정을 과감하게 빼버리고 프로젝트 단위의 연습을 들어가는 것도 좋음
- 프로젝트 단위의 연습을 하다 보면 빈번하게 사용되는 코드들이 여러 프로젝트에서 반복적으로 노출이 되기 때문에 자연스럽게 우선순위에 맞는 내용들을 채득할 수 있음
파이썬의 쉬운 예제 코드들
- 파이썬 기초를 공부하는데 어려움을 느끼거나 지루함을 느끼신다면 쉬운 예제 코드들을 찾아보시는 것도 방법임
- 관련된 학위가 없는 비전공자라면 컴퓨터 사이언스나 데이터 사이언스 분야를 졸업한 사람들에 비해서 잡마켓에서 매력도가 떨어질 수밖에 없음
- 데이터 사이언티스트나 데이터 애널리티스트 포지션을 노리시기보다는 데이터를 만질 수 있는 다른 포지션으로 시작을 해서 자연스럽게 영역을 넓혀가는 것도 방법임
머신러닝 모델을 코딩 없이 만드는 툴
- 머신러닝을 독학하고 유관 부서에 연락을 해서 머신러닝 모델을 코딩 없이 만들 수 있는 툴의 라이센스를 받아서 직접 모델링을 해봄
- 빅데이터 분석 그룹에서 인력을 충원한다는 공고가 나와서 지원을 했더니 데이터 분석가로 일할 수 있는 기회가 주어짐
- 다른 포지션으로 시작을 한다고 하더라도 적극적으로 관련 프로젝트를 리드해서 본인의 역량을 키운다면 이쪽 분야에 본격적으로 발을 들여놓을 수 있는 기회도 찾아올 거라고 생각함
데이터 사이언스 공부를 위한 팁
- 데이터 사이언스 공부를 위한 팁 중 가장 중요한 것은 방향성임
- 대학원 프로그램을 들어가면 어느 정도 커리큘럼이 잡혀 있기 때문에 그걸 따라가는 과정이 상대적으로 스무스하고 불안감이 조금 적음
- 반대로 혼자 공부를 하는 입장이면 어떤 것부터 어떻게 공부해야 될지 모르고 방향성에 대해 스스로도 계속 의문을 품다 보니까 계속 이거 했다가 저거 했다가 수정하는 경우도 많고, 시간을 낭비하고, 끝까지 공부를 잡고 있지 못하고 중간에 포기해버리는 경우도 많이 생기게 됨
온라인 학습 자료
- 시중에 나와 있는 책이나 인터넷 강의를 구입하지 말고 목차들만 한번 쭉 모아서 훑어보면 빈번하게 자주 등장하는 주제들이 있을 것임
- 그런 것들을 따로 정리를 해가지고 구글에서 검색을 해보면 무료로 올라와 있음
- 온라인에는 학습할 수 있는 수많은 리소스들이 존재함
구글의 데이터 사이언스 사이트
- 머신러닝 관련된 데이터 사이언스 관련된 검색을 했을 때 구글에서 빈번하게 등장하는 사이트들이 몇 개 더 있기는 함
- 이중에서 가장 추천드리는 건 투 데이러 사이언스임
- 입문자들이 보기에 굉장히 편하게 준비가 되어 있음
- 영어 공부를 꾸준히 해서 영어로 된 콘텐츠들에 익숙해지시는 게 좋음
케글의 컴피케이션
- 데이터를 어디서 찾는지에 대해 두 가지 사이트를 추천함
- 첫 번째는 케글이고 두 번째는 오픈 ml이라는 사이트임
- 케글은 컴피케이션으로 유명한 사이트임
데이터셋 검색
- 데이터를 가지고 뭘 할지 찾아내는 것도 중요한 스킬임
- 데이터를 찾기 위해서는 데이터셋 바로 위에 있는 컴피티션을 클릭하면 됨
- 이미 완료된 컴퓨티션도 접근을 할 수 있음
- 스스로 연습을 해보고 내가 이 컴피티션에 참여했으면 나는 이 정도 등수쯤 됐겠다라는 비교도 해볼 수 있음
데이터 사이언티스트의 일상
- 캐나다 토론토에 거주하고 있는 글로벌 제약회사 커머셜팀에서 데이터 사이언티스트로 일하고 있음
- 데이터 사이언티스트가 하는 일을 간단하게 표현해 보자면 어떤 질문이 있을 때 그 질문을 숫자로 답해주는 일을 함
- 데이터 사이언티스트의 일상은 프로젝트에 어디에 해당하느냐에 따라서 굉장히 다양한 일을 하게 됨
데이터 사이언티스트의 역량
- 데이터 사이언티스트는 업무 과정에서 실수를 줄인다거나 최소화하는 게 중요함
- 질문을 할수록 실수를 줄인다든가 혹은 더 나은 방향으로 계속 찾아보게 됨
- 질문을 하고 답하는 과정에서 커뮤니케이션 기술도 향상시킬 수 있고 업무 지식이나 내가 필요한 지식이 무엇인지 찾아보는 과정도 접하게 됨
- 데이터 사이언티스트의 가장 중요한 역량은 질문하기라고 생각함
공부 잘하는 사람들의 특징
- 프로젝트 하기 전에 했던 질문들, 프로젝트가 끝나면 질문하지 못했던 것들을 다시 한 번 확인해 보기도 함
- 다음 프로젝트에는 반영해야겠다 다짐하면서 부담감을 기대감으로 바꾸려고 노력함
- 공부 잘하는 사람들은 워낙 많았음
- 내가 다른 사람들과 비교했을 때 어떤 것보다 낫다라는 게 전혀 없었음
- 중간에 그만두지 않으면 이해하는 순간이 옴
- 잘한다는 건 자랄 때까지의 과정을 반복해서 학습을 해야 함
- 공부 방법은 다른 사람이 작성한 코딩 스크립트를 읽는 것임

이하얀

언젠가 내 코드로 세상에 기여할 수 있도록, Data Science&BE 개발 기록 노트☘️

이전 포스트

⏰SEF2023 - "DAY1. LEARN 당신도 배울 수 있습니다." 정리

다음 포스트

⏰SEF2023 - "DAY2.GROW AI와 함께하는 성장" 정리

💭 SEF2023

⏰SEF2023 - "DAY1. LEARN 당신도 배울 수 있습니다." 정리

⏰SEF2023 - "DAY3. CHANGE 세상이 변하면 우리도 변해야 하니까" 정리

0개의 댓글