profile
M.S Student in Data Intensive Computing Lab SKKU.
post-thumbnail

RadixSpline: A Single-Pass Learned Index

Learned Index란 Kraska et el.이 만든 모델로, 여러 계층의 머신 러닝 모델로 구성되어 있다. Read query가 주어 졌을 떄, 모델의 middle node는 leaf node를 pointing 해주고, leaf node에서는 CDF로 부터 학습

2022년 2월 27일
·
0개의 댓글
·
post-thumbnail

HBase Bloom Filter

Bloom Filter는 특정 집합내에 특정 원소가 존재하는지 확인하는데 사용되는 자료구조이다. 따라서 I/O의 관점에서 봤을 때, 특정 파일내부에 원하는 데이터의 여부를 빠르게 알 수 있기 때문에 I/O 횟수를 줄일 수 있다는 장점이 있다. 하지만, Bloom Fil

2022년 2월 10일
·
0개의 댓글
·
post-thumbnail

Computer Science Terminology

Write Operation은 SSD나 Main memory에서 granuality에 맞춰서 발생하므로 (가령 cache-line granuality), 해당 크기와 일치하지 않는 모든 write operation은 부가적인 write 과정이 필요하다. 부가적인 wri

2022년 1월 27일
·
0개의 댓글
·
post-thumbnail

HBase Overall Structure Part2.

클라이언트에서 데이터를 PUT하라는 쿼리가 발생하면, 해당 데이터는 WAL에 기록된다. WAL은 Write-Ahead Log로 입력된 데이터를 append형식으로 관리한다. WAL에 쌓인 데이터는 Memstore로 copy가 된다. 이때 클라이언트에 데이터가 성공적으로

2022년 1월 18일
·
0개의 댓글
·
post-thumbnail

HBase Overall Structure Part 1.

Hadoop Software Library는 간단한 프로그래밍 모델을 사용하여 여러대의 클러스터에서 대규모 데이터 세트를 분산 처리 할 수 있게 해주는 프레임워크이다. Hadoop은 대용량 데이터를 적은 비용으로 더 빠르게 분석할 수 있는 소프트웨어이며, 빅데이터 처리

2022년 1월 18일
·
0개의 댓글
·
post-thumbnail

WORT: Write Optimal Radix Tree for Persistent Memory Storage Systems

Persistent memory는 byte addressable하고 non-volatile한 특성을 지니고 있어서, PCI interface를 사용하지 않고 memory bus를 통해서 접근이 가능하다. 그리고 failure atomicity unit은 8 bytes보

2022년 1월 16일
·
0개의 댓글
·
post-thumbnail

HBase BlockCache

HFile의 구성 요소중 하나인 Data Block은 Key-Value의 형태로 이루어진 데이터를 저장하고 있는 block이다. 즉 Data Block은, MemStore로 부터 Flush operation이 수행되었을 때, MemStore에 저장하고 있던 Key-Va

2022년 1월 12일
·
0개의 댓글
·
post-thumbnail

NVMe-CR: A Scalable Ephemeral Storage Runtime for Checkpoint/Restart with NVMe-over-Fabrics

NVMe-over-Fabrics (NVMf) standard NVMe-over-Fabrics (NVMf) standard is an extension of the NVMe standard to allow remote access to SSDs using fast RDM

2022년 1월 11일
·
0개의 댓글
·
post-thumbnail

AC-Key: Adaptive Caching for LSM-based Key-Value Stores

LSM tree는 append 하는 형식으로 write operation을 처리하기 때문에 write 성능에 있어서는 다른 Key-Value 데이터베이스 시스템에 비해 우위를 점한다. 하지만 level structure를 두어 데이터를 관리하기 때문에 read perf

2022년 1월 11일
·
0개의 댓글
·
post-thumbnail

HydraList- A scalable In-Memory Index Using Asynchronous Updates and Partial Replication

Hardware 기술이 발전함에 따라, 점차 Main Memory 크기가 증가하는 추세를 보이고 있고, 이는 in-memory database의 발전으로 이어지고 있습니다. 따라서 database의 index strucuture의 중요성이 증가하고 있는 추세입니다.

2022년 1월 11일
·
0개의 댓글
·