데이터베이스의 역사에 대한 좋은 유튜브가 있어서 소개합니다.
아래는 유튜브 내용 요약본입니다.
1. 데이터의 기계적 표현의 시작 (1800s)
1800년대 초반 – 펀치 카드의 등장
- 조제프 마리 자카르(Joseph Marie Jacquard)
- 프랑스 직물 공장에서 펀치 카드(punch card) 를 이용해 직조 패턴을 제어
(데이터를 물리적인 매체로 표현한 최초의 사례)
- 훗날 “데이터는 기계가 읽을 수 있는 언어”라는 개념의 출발점이 됨
1890년 – 미국 인구조사(Census) 위기
- 인구 증가로 수작업 집계가 불가능해짐
- 허먼 홀러리스(Herman Hollerith) 가 펀치 카드 기반 자동 집계 시스템 개발
- 처리 시간이 10년 → 2~3년으로 단축
이 기술이 발전해 훗날 IBM(International Business Machines) 설립으로 이어짐
이 시점부터 펀치 카드 = 데이터 저장 수단이 됨
2. 전자식 저장 매체의 시대 (1950s)
1950년대 – 자기 테이프(Magnetic Tape)
- 펀치 카드 → 자기 테이프
- 대량 데이터 저장 가능
- 순차 접근(Sequential Access) 방식
3. 초기 데이터베이스 모델의 등장 (1960s)
1960년대 초 – Network Model
- 찰스 바크만(Charles Bachman)
- GE(General Electric)에서 IDS (Integrated Data Store) 개발
- 데이터 간 관계를 그래프 구조(Network Model) 로 표현
최초의 “DBMS” 개념에 가까운 시스템
1960년대 중반 – 항공 예약 시스템
- American Airlines + IBM : AA의 CEO와 IBM 영업사원이 우연히 비행기 안에서 만남
- SABRE (Semi-Automated Business Research Environment) 프로젝트
- IBM 7090 메인프레임 2대로 항공 예약 시스템 구축
Hierarchical Database Model 사용
실시간 트랜잭션 처리의 시초
이 기술은 이후 IBM IMS로 발전
4. 관계형 데이터베이스의 탄생 (1970s)
1970년 – 관계형 모델(Relational Model)
- 에드거 프랭크 커드(Edgar F. Codd)
- 연국인, IBM 연구원, 수학자
「A Relational Model of Data for Large Shared Data Banks」 논문 발표
핵심 개념: 데이터는 테이블(Row + Column) 로 표현
물리적 저장 방식과 논리적 모델 분리
현대 데이터베이스의 근간
1970년대 중반 – 관계형 DB 실험
- Ingres 프로젝트 (미국 정부 지원)
Michael Stonebraker, Eugene Wong
Codd 이론의 실제 구현 검증
프로젝트 참여자들이 훗날: Oracle, Sybase, Informix 설립
- IBM System R 프로젝트
IBM 내부 관계형 DB 연구
Don Chamberlin, Raymond Boyce
SQL(Structured Query Language) 개발
1970년대 후반 – IBM의 선택
- IBM은 IMS(계층형 DB) 가 이미 큰 수익을 내고 있었음
관계형 DB 상업화에 소극적
이 틈을 타 Larry Ellison 이 기회를 포착
5. RDBMS의 상업화 (1980s)
1979년
Larry Ellison Relational Software Inc. 설립 (후의 Oracle)
IBM System R의 SQL 문법을 참고해 상용 DB 개발
1983년 IBM DB2 출시
1986년 ANSI / ISO SQL을 관계형 데이터베이스 표준 언어로 채택
RDBMS가 산업 표준으로 자리 잡음
6. 객체지향 DB와 한계 (1990s)
1990년대 객체지향 패러다임 확산
- Object Database / ORDBMS
Objectivity/DB, Versant
하지만: 복잡성, 낮은 성능, 생태계 부족
상업적으로 큰 성공을 거두지 못함
7. 빅데이터와 NoSQL의 등장 (2000s)
2000년대 초반
- 인터넷, 로그, 사용자 데이터 폭증
- 기존 RDBMS로는: 수평 확장(Scale-out) 초대용량 처리가 어려워짐
2006년 Google Bigtable 논문 발표
2007년 Amazon Dynamo 논문 발표
분산 데이터베이스의 새로운 패러다임 제시
- NoSQL의 등장
Cassandra
MongoDB
HBase 등
- CAP 이론에 따른 선택
ACID 일부 포기
대신: BASE (Basically Available, Soft State, Eventual Consistency)
8. 현대 데이터베이스 생태계
목적별 DB 분화
PostgreSQL / Oracle → 트랜잭션 처리
Redis → 캐싱 / 인메모리
Elasticsearch → 검색
Neo4j → 그래프 / 추천
Time Series DB → IoT
Vector Database → AI / LLM / 임베딩 검색
“하나의 DB로 모든 문제를 해결”하는 시대는 종료
9. 미래 – Quantum Database?
양자 컴퓨팅 기반 데이터 처리 연구 단계
병렬성·확률 기반 연산 활용
아직은 이론 및 실험 수준
데이터베이스의 역사는
데이터를 어떻게 저장할 것인가 →
어떻게 빠르게 찾을 것인가 →
어떻게 분산해서 처리할 것인가
를 해결해 온 과정이다.