# dataset

48개의 포스트
post-thumbnail

Train Validation Test Dataset and K-Fold Validation

개인적으로 평소에 train validation test dataset 의 차이 정도는 알고 있었지만 이 공부를 통해 더 확실하게, 그리그 그 쓰임새까지 알 수 있게 되었다. 그리고 K-Fold Validation 을 처음에는 잘 이해 못했는데, 이제는 잘 알 것 같다

2일 전
·
0개의 댓글
post-thumbnail

[Linux Server] Download ImageNet-1K

Download ImageNet-1K train/val dataset from academic torrents using transmissionInstall transmission-daemon on linux serverCheck if transmission works

2022년 6월 3일
·
0개의 댓글

라벨링, Labeling, 🏷

어떤 데이터가 있다. 해당 데이터는 이미지나 글자, 소리 등이 될 수 있다. 해당 데이터는 자체적으로 정보(Information)를 나타내고 있다. 하지만 데이터 내 정보 속에 담긴 의미(Knowledge)는 정보를 보고 찾아야 한다. 데이터 속에 정보(Informat

2022년 5월 31일
·
0개의 댓글

[Dataset] class instance number checker

class변수의 개수를 추가하여서 실행

2022년 5월 28일
·
0개의 댓글

How to get "Commodity Price, Currency" Data

Commodity Price Data (API)Gold (quandl)SilverCopperOilDGS20, DGS10, DGS5, DGS2, DGS1T10Y2Y

2022년 5월 27일
·
0개의 댓글
post-thumbnail

LAION-400M 데이터셋 다운받기

딥러닝 학습을 위해서는 막대한 양의 데이터셋이 필요합니다.LAION-400M은 무료 공개된 대규모 데이터셋으로,높은 퀄리티의 image-text pair 데이터를 제공하고 있습니다.Multi modal 인식을 위한 모델 학습 시 400M 개 정도의 데이터를 유용하게 사

2022년 5월 17일
·
0개의 댓글

dataset 05.웹페이지 시작하기

특정데이터를 DOM요소에 저장해두기 위해브라우저는 데이터 속성에 어떠한 행동도 관여하지 않기 때문에 개발자는 요소에 특정한 데이터를 저장하고 싶은경우 자유롭게 사용가능데이터속성 조작은 자바스크립트에서 dataset객체를 통해 조작가능HTML5부터는 HTML

2022년 5월 16일
·
0개의 댓글
post-thumbnail

Problem Setting and Regularization

training을 하기 위해서 결정해야 할 것들이 정말 많지만 각 hyperparameter 사이에 dependency가 있기 때문에 guess가 매우 어렵다. 그렇기 때문에 실제로 machine learning은 굉장히 반복적인 작업이다. Dataset 좋은 cho

2022년 4월 17일
·
0개의 댓글

[Dataset] Udacity2 to YOLO

fixed largeselect darknet annotationhttps://public.roboflow.com/object-detection/self-driving-carchange udacity class number to custom dataset cl

2022년 4월 8일
·
0개의 댓글

dataset

🐇 접근 모든 Element에서 data-로 시작하는 속성에 대해 모두 접근할 수 있습니다. 🥕 JavaScript에서 접근하기 🥕 Css에서 접근하기 🐇 유의사항 위 두가지의 경우 data-keyword인 항목은 정상작동하지만, data-word인 경우 undefined를 반환함.

2022년 3월 31일
·
0개의 댓글
post-thumbnail

Data Augmentation

일반적으로 딥러닝 모델을 학습시키기 위해서는 데이터셋이 필요하다.대표적인 이미지 데이터셋인 이미지넷(ImageNet)은 약 1,400만 장의 이미지를 가지고, CIFAR-10도 6만장의 이미지 데이터를 가지고 있다.문제는 큰 규모의 데이터셋을 만드는 것은 큰 비용이 드

2022년 3월 27일
·
0개의 댓글
post-thumbnail

학습 데이터셋 전처리

학습 데이터 전처리란 무엇을 말하는걸까요? 인공지능을 학습시키기 위해서는 인공지능이 이해할 수 있는 형태로 데이터를 가공해야 합니다. 조금이라도 규격에 맞지 않으면 인공지능의 정확도가 떨어질 수 있으므로 세심한 주의가 필요한 과정이지요.

2022년 3월 10일
·
0개의 댓글
post-thumbnail

학습 데이터 관리 프로세스

학습 데이터셋이란 인공지능이 특정 사물을 인지할 수 있도록 도와주는 여러가지 정보가 담긴 데이터셋을 의미합니다. 인공지능의 성능을 향상시키기 위해서는 양질의 데이터셋이 필요하지요. 이번 포스팅에서는 학습 데이터 관리 프로세스를 크게 7단계로 나누어보았습니다.

2022년 3월 4일
·
0개의 댓글
post-thumbnail

학습 데이터 관리 프로세스

학습 데이터셋이란 인공지능이 특정 사물을 인지할 수 있도록 도와주는 여러가지 정보가 담긴 데이터셋을 의미합니다. 데이터셋 구축을 위해서는 위와 같이 여러 단계를 거치게 되는데요, 이번 포스팅에서는 학습 데이터 관리 프로세스를 크게 7단계로 나누어보았습니다.

2022년 2월 16일
·
0개의 댓글

2주차 Dataset 과제 정리

init : 데이터의 위치나 파일명과 같은 초기화 작업을 위해 동작한다. 일반적으로 CSV, XML파일과 같은 데이터를 불러온다. 여기에 이미지를 처리할 transforms들을 Compose해서 정의해둔다.len : Dataset의 최대 요소 수를 반환하는데에 사용한다

2022년 2월 1일
·
0개의 댓글

[스터디] 스파크 완벽 가이드 11일차

Dataset은 구조적 API의 기본 데이터 타입이다. 앞서 살펴본 DataFrame은 Row타입의 Dataset이다. Dataset은 JVM을 사용하는 언어인 스칼라와 자바에서만 사용할 수 있다. 그렇다면 Dataset을 사용해야하는 이유는 무엇일까?

2022년 1월 28일
·
0개의 댓글

The Dialogue Dodecathlon: Open-Domain Knowledge and Image Grounded Conversational Agents

대화 에이젼트가 personality와 empathy를 가지고 아래와 같은 능력이 있는지 평가하는 12가지 태스크를 정의하고 평가함

2022년 1월 16일
·
0개의 댓글

[스터디] 스파크 완벽 가이드 4일차

구조적 API에는 3가지 분산 컬렉션이 존재한다.DataSetDataFrameSQL 테이블과 뷰배치와 스트리밍처리에서 구조적 API를 사용할 수 있으며, 구조적 API를 활용해 배치 작업을 스트리밍 작업으로 변환할 수 있다.

2022년 1월 11일
·
0개의 댓글