(ν΄λΉ κΈμ μλ λͺ
μν μΆμ²μ κΈμ νκΈλ‘ κ°μ λ° μμ½ν λ΄μ©μ
λλ€.)
π₯ μ΅μμ λ°μ΄ν° μμ§λμ΄λ€μ 곡ν΅μ
μ΄λ€μ λ°μ΄ν°λ₯Ό λ¨μν κ°μ΄ μλλΌ, νλ¦(flow) μΌλ‘ λ΄ λλ€.
λΆμ° μμ€ν (HDFS, S3), λ°°μΉ vs. μ€νΈλ¦Ό μ²λ¦¬ μ°¨μ΄λ₯Ό μ§κ΄μ μΌλ‘ μ΄ν΄ν¨.
μ μ₯ ν¬λ§·(Parquet, Avro) μ₯λ¨μ μ λΉ λ₯΄κ² νλ¨ν μ μμ.
π λ°μ΄ν°λ₯Ό "μ΄λ»κ² μ΅μ μ λ°©μμΌλ‘ μ λ¬ν κΉ?"λ₯Ό λ¨Όμ κ³ λ―Όν©λλ€.
SQLλ§ μνλ κ² μλλλ€. 볡μ‘ν λ¬Έμ λ₯Ό λ Όλ¦¬μ μΌλ‘ ν΄κ²°νλ λ₯λ ₯μ΄ λ°μ΄λ©λλ€.
Python, Scala, Javaλ₯Ό λ₯μνκ² λ€λ£¨λ©°, κ°λ μ± μ’μ μ½λλ₯Ό μμ±.
μλ£κ΅¬μ‘°μ μκ³ λ¦¬μ¦μ μ΄ν΄νκ³ , μ±λ₯ μ΅μ ν κ°κ°μ΄ μμ.
π μ΄λ€μ "μ΄λ»κ² νλ©΄ λ ν¨μ¨μ μΌλ‘ λ¬Έμ λ₯Ό ν΄κ²°ν κΉ?"λ₯Ό λμμμ΄ κ³ λ―Όν©λλ€.
μ΄λ€μ νμ΄νλΌμΈμ λ§λ€κ³ λμ΄ μλλΌ, μ΅μ νλ₯Ό νμ κ³Όμ μΌλ‘ μκ°ν©λλ€.
Spark λλ²κΉ λ₯λ ₯μ΄ λ°μ΄λκ³ , λ³λͺ© νμμ λΉ λ₯΄κ² μ°Ύμ.
νν°μ λ, λ²μΌν μ νμ©ν΄ λμ©λ λ°μ΄ν°λ λΉ λ₯΄κ² μ²λ¦¬.
π κ·Έλ₯ μλνλ μ½λκ° μλλΌ, "μ΅μ μ μ±λ₯μ λ΄λ μ½λ"λ₯Ό λ§λλλ€.
λ¨μν ν΄λΌμ°λλ₯Ό μ¬μ©νλ κ² μλλΌ, λΉμ©κ³Ό μ±λ₯μ κ³ λ €ν μ΅μ μ μ‘°ν©μ μ°Ύμ΅λλ€.
AWS, GCP, Azure νμ©μ λ₯μνλ©°, EMR, Databricks, Kubernetesμ μ°¨μ΄λ₯Ό λͺ νν μ΄ν΄.
Terraform κ°μ IaC(Infrastructure as Code) λꡬλ₯Ό λ₯μνκ² λ€λ£Έ.
π "μ΄λ€ μλΉμ€λ₯Ό μ¬μ©ν κΉ?"κ° μλλΌ, "κ°μ₯ ν¨μ¨μ μΈ μ‘°ν©μ 무μμΌκΉ?"λ₯Ό κ³ λ―Όν©λλ€.
λ§μ λ°μ΄ν°λ³΄λ€ μ λ’°ν μ μλ λ°μ΄ν°κ° μ€μν¨μ μλλ€.
λ°μ΄ν° κ²μ¦ λ° λͺ¨λν°λ§(Great Expectations λ±) νμ©.
λ°μ΄ν°κ° μΈμ , μ΄λμ, μ΄λ»κ² μμ±λμλμ§ λͺ νν μΆμ κ°λ₯.
π "μ΄ λ°μ΄ν°κ° μ ννκ°?"λ₯Ό νμ λ¨Όμ κ³ λ €ν©λλ€.
β
μ£ΌμΈμμ β λ¬Έμ λ₯Ό λκΉμ§ ν΄κ²°νλ νλ.
β
νΈκΈ°μ¬ β λ¨μν μ¬μ©μ΄ μλλΌ, μ리λ₯Ό κΉμ΄ μ΄ν΄.
β
μ€νλ ₯ β μ΄λ‘ μ΄ μλλΌ, μ€μ λ‘ μ€ννκ³ κ°μ .
β
λΉμ¦λμ€ κ°κ° β λ°μ΄ν°λ₯Ό ν΅ν΄ μ€μ κ°μΉλ₯Ό μ°½μΆνλ μ¬κ³ λ°©μ.
π μ΄λ€μ "μ’μ μμ§λμ΄"κ° μλλΌ, "λΉμ¦λμ€μ κΈ°μ¬νλ μμ§λμ΄"μ λλ€.
β
λ°μ΄ν°λ₯Ό νλ¦μΌλ‘ μ΄ν΄νκ³ , μ΅μ μ μ€κ³λ₯Ό κ³ λ―Όν¨.
β
μ±λ₯ μ΅μ νκ° λͺΈμ λ°°μ΄ μμ.
β
ν΄λΌμ°λλ₯Ό λ¨μ μ¬μ©μ΄ μλλΌ, ν¨μ¨μ μΌλ‘ νμ©ν¨.
β
λ°μ΄ν° νμ§μ μ² μ ν κ΄λ¦¬νλ©°, μ λ’°ν μ μλ λ°μ΄ν°λ₯Ό λ€λ£Έ.
β
λ¨μν μ½λκ° μλλΌ, λ¬Έμ ν΄κ²° λ₯λ ₯μ κ°μΆ μ λ¬Έκ°.
π‘ μ΅κ³ μ λ°μ΄ν° μμ§λμ΄λ€μ λ¨μν ν΄μ μ μ°λ κ²μ΄ μλλΌ, λ°μ΄ν°λ‘ κ°μΉλ₯Ό λ§λλ μ¬λλ€μ λλ€.
βΆ μΆμ² : https://blog.det.life/i-interviewed-200-data-engineers-heres-what-separates-the-best-from-the-rest-3092524e5875