MS AI School Day 30

Joy·2023년 5월 15일
0

MS AI School

목록 보기
31/101


1데이터 수집-2복사(스냅샷)읽기저장-3정형반정형비정형모두 모임

데이터역할 및 서비스

  • ETL : 추출, 변환, 로드

관계형 데이터의 기본사항 살펴보기

  • 개념
  • Azure 서비스 탐색

표준화, 정규화


rdbms
realation db manage system
여러개 관리

  • 보기, view
  • 저장 프로시저,
  • 인덱스, Index (줄 세우기)

테이블의 각 행은 엔티티의 단일 인스턴스.
SQL문
SELECT : 테이블을 쿼리하여 데이터를 반환할 때 사용하는 SQL문.
QUERY
READ
인덱스란? 쿼리가 테이블의 행을 빠르게 찾도록 해 주는 구조.
VIEW?

관계형 데이터에 대한 Azure의 서비스.
Azure SQL (MS SQL)

3가지

오픈소스

랩에 대한 가상머신
https://microsoftlearning.github.io/DP-900T00A-Azure-Data-Fundamentals/Instructions/Labs/dp900-01-sql-lab.html

프라이빗 엔드포인트와 퍼블릭 엔드포인트에 대한 특징 :

프라이빗 엔드포인트 (Private Endpoint)퍼블릭 엔드포인트 (Public Endpoint)
정의특정 네트워크 내에서만 액세스할 수 있는 서비스의 접점입니다.인터넷에서 직접 액세스할 수 있는 서비스의 접점입니다.
접근성사설 네트워크 (예: VPN, VPC) 내에서만 접근 가능합니다.인터넷에 연결된 모든 장치에서 접근 가능합니다. 일반적으로 특정 IP 주소 또는 IP 주소 범위에서만 액세스할 수 있도록 제한됩니다.
사용 사례데이터를 보호하고, 서비스를 특정 사용자 그룹에게만 제한하려는 경우에 사용됩니다.웹사이트, 웹 서비스, API 등에 널리 사용됩니다.
보안보안 요구 사항이 높은 경우나 내부 네트워크에서만 서비스를 사용해야 하는 경우에 적합합니다.보안 요구 사항이 상대적으로 낮고, 널리 공개되어야 하는 서비스에 적합합니다.


  • SELECT
  • JOIN

[용어]

Elastic Pool : 동일한 리소스를 갖는경우 그룹화하여 효율적인 관리가능, 사용패턴에따라 개별적으로 할당하는것이 효율적.

RDP와 Azure Bastion에 대한 주요 특징 :

RDP (Remote Desktop Protocol)Azure Bastion
정의마이크로소프트에서 개발한 원격 컴퓨터 접속 프로토콜입니다.Azure에서 제공하는 관리형 네트워크 보안 서비스입니다.
기능원격 위치에서 컴퓨터 또는 가상 머신에 접속하고 제어하는 데 사용됩니다.Azure 가상 머신에 원격으로 안전하게 접속하는 데 사용됩니다.
보안보안 설정이 적절히 이루어지지 않으면 공격에 취약할 수 있습니다.직접 공용 인터넷에 노출되지 않은 가상 머신에 안전하게 접속할 수 있습니다.
사용 방법RDP 클라이언트를 통해 원격 컴퓨터에 접속합니다.Azure 포털을 통해 가상 머신에 접속합니다. VPN이나 별도의 접속 게이트웨이가 필요 없습니다.

SQL

1) W3Schools (SQL Tutorial):

https://www.w3schools.com/sql/

2) SQLZoo

https://sqlzoo.net/

3) Khan Academy
(Intro toSQL)

https://www.khanacademy.org/computing/computer-programming/sql

Azure의 비관계형 데이터의 기본 사항 살펴보기

  • Azure Storage 기본사항
  • Azure cosmos DB의 기본사항

Azure Blob Storage
Binary Large Object로서의 데이터에 대한 스토리지

1) 블록 Blob
2) 페이지 Blob
3) 추가 Blob

핫, ssd, 금방 등록, 비용 높지만 속도빠름.
쿨, hdd
보관, 아카이브, 느리고 저렴, 잘 안쓰는 데이터.

케이스에따른 이용방법


Explore Azure Storage 실습

1) Blob Storage

2) Azure Data Lake Storage Gen2

업그레이드

Azure Data Lake Gen2 기능을 사용하여 스토리지 계정으로 업그레이드
데이터 분석 및 빅 데이터 스토리지에 스토리지 계정을 사용하려는 경우 Azure Data Lake Storage Gen2로 업그레이드하여 계정에서 계층 구조 네임스페이스를 사용하도록 설정.


3) Files
공유하기

4) Table

Cosmos DB



Azure Cosmos DB는 마이크로소프트가 제공하는 글로벌 분산, 멀티모델 데이터베이스 서비스. 이 서비스는 특히 클라우드 애플리케이션을 위해 설계.

  • Azure Cosmos DB의 주요 특징 :
  1. 글로벌 분산: Azure Cosmos DB는 사용자가 데이터를 여러 지역에 복제하고, 이를 통해 데이터를 사용자에게 더 가깝게 유지할 수 있게 해줍니다. 이는 더 나은 접근성과 빠른 응답 시간을 제공합니다.

  2. 멀티모델: Azure Cosmos DB는 키-값, 문서, 그래프, 칼럼 패밀리 등 다양한 데이터 모델을 지원합니다. 이는 개발자가 자신의 애플리케이션에 가장 적합한 데이터 모델을 선택할 수 있게 해줍니다.

  3. 다중 API 지원: Azure Cosmos DB는 SQL, MongoDB, Cassandra, Gremlin, Table API 등 다양한 API를 지원하여, 개발자가 편리하게 데이터를 쿼리하고 처리할 수 있게 해줍니다.

  4. 자동 확장성: Azure Cosmos DB는 통합된 확장성을 제공하여, 사용량이 증가하거나 감소함에 따라 자동으로 리소스를 조절할 수 있습니다.

  5. 실시간 분석: Azure Cosmos DB는 실시간 분석 기능을 제공하여, 대량의 데이터를 실시간으로 처리하고 분석할 수 있습니다.

  6. 높은 가용성: Azure Cosmos DB는 데이터 복제를 통해 높은 가용성을 제공합니다. 또한, 여러 지역에 걸쳐 데이터를 복제함으로써 지역적인 장애에 대비할 수 있습니다.

이러한 특성 덕분에 Azure Cosmos DB는 전 세계 어디에서나 높은 성능과 빠른 응답 시간을 제공하며, 다양한 데이터 모델과 API를 지원하여 개발자의 요구에 맞춰 유연하게 사용.

읽기전용

ETL, ELT


Explore data analytics in Azure with Azure Synapse Analytics

https://web.azuresynapse.net/ko/home?workspace=%2Fsubscriptions%2F7ad28d1d-a2a6-4086-8be0-4c877e108b94%2FresourceGroups%2Flabuser15%2Fproviders%2FMicrosoft.Synapse%2Fworkspaces%2Fsynapse-managed-rg15

Synapse Analytics

Use a SQL pool to analyze data
이제 일부 데이터를 작업 영역에 수집했으므로 Synapse Analytics를 사용하여 쿼리하고 분석가능.

데이터를 쿼리하는 가장 일반적인 방법 중 하나는 SQL을 사용하는 것이며, Synapse Analytics에서 SQL 풀을 사용하여 SQL 코드를 실행.




데이터 시각화

(윈도우, ios, 안드로이드)


MS Power BI

Explore fundamentals of data visualization with Power BI
여러 데이터 원본에서 데이터를 가져오고 보고서를 만드는데 사용해야 하는 도구.

드릴 업/다운

차트별 어떤유형의 시각화에 도움이 되는지 확인.

MS Learn
DP-900

profile
🐣비전공자의 AI 입문기🐣

0개의 댓글