gcloud auth list
- 활성 계정 이름을 나열gcloud config list project
- 프로젝트 ID를 나열 bq show bigquery-public-data:samples.shakespeare
bq
- BigQuery 명령줄 도구를 호출show
- actionproject:public dataset.table
- 보고 싶은 BigQuery 의 이름을 나열bq help query
bq query "[SQL_STATEMENT]”
와 같은 명령어 필요bq query --use_legacy_sql=false \
'SELECT
word,
SUM(word_count) AS count
FROM
`bigquery-public-data`.samples.shakespeare
WHERE
word LIKE "%raisin%"
GROUP BY
word'
bq query --use_legacy_sql=false \
'SELECT
word
FROM
`bigquery-public-data`.samples.shakespeare
WHERE
word = "huzzah"'
새 데이터세트 만들기
bq ls
- 기존 데이터세트 나열bq ls
로 실행합니다. bq ls bigquery-public-data:
bq mk babynames
로 새 데이터세트를 만듭니다. 데이터세트 업로드
babyname 데이터파일 url을 이용하여 프로젝트에 추가합니다
curl -LO http://www.ssa.gov/OACT/babynames/names.zip
ls
압축 풀기 unzip names.zip
데이터 로드 bq load
로드정보를 추가하여 로드 bq load babynames.names2010 yob2010.txt name:string,gender:string,count:integer
완료된 작업 테스트
bq ls babynames
- 데이터세트 확인
bq show babynames.names2010
- 스키마 조회
name, gender, count
bq query "SELECT name,count FROM babynames.names2010 WHERE gender = 'F' ORDER BY count DESC LIMIT 5”
bq query "SELECT name,count FROM babynames.names2010 WHERE gender = 'M' ORDER BY count ASC LIMIT 5”
bq rm
을 실행햐여 데이터세트의 모든 테이블을 삭제합니다. bq rm -r babynames
참고
BigQuery: Qwik Start - Command Line | Google Cloud Skills Boost