Google Vertex AI ( PaLM2 ) 리전 확대

Harrison Jung·2023년 11월 3일
0

오늘.. Google의 PaLM2 모델을 서빙하는 Vertex AI 에서 리전을 확대했다.
기존에는 us-central ( 미국 Iowa ) 에서만 가능했는데, asia-northeast3 ( 서울 )이 추가되면서, 조금 더 빨라짐.

자세한 정보는 링크에..
https://cloud.google.com/vertex-ai/docs/generative-ai/learn/locations-genai

Output 128 Token 짜리로 테스트해본 벤치마크 결과.


PaLM2 - us-central1: 4.952s
PaLM2 - us-west4: 3.319s
PaLM2 - northamerica-northeast1: 3.822s
PaLM2 - us-east4: 3.196s
PaLM2 - us-west1: 3.129s
PaLM2 - europe-west1: 3.428s
PaLM2 - europe-west3: 3.533s
PaLM2 - europe-west2: 3.913s
PaLM2 - europe-west4: 3.418s
PaLM2 - europe-west9: 3.874s
PaLM2 - asia-northeast3: 4.912s
PaLM2 - asia-northeast1: 4.015s
PaLM2 - asia-southeast1: 3.277s

profile
차세대 생성형 AI 블로그 서비스 "두루미스"를 만들고 있는 개발자

0개의 댓글