일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 코딩
- loaddata
- dumpdata
- 프리워커스
- Python
- VSCode
- Coding
- 파라미터
- wecode
- Web
- CSS
- html #css #코딩 #입문 #코딩시작하기 #코딩입문 #파이썬 #자바스크립트 #비전공자 #비전공 #코딩학원
- LIST
- 싸피
- dangerouslySetInnerHTML
- listdir
- SSAFY
- phython
- 프로그래밍폰트
- 역사
- TIL #todayilearn #math #javascript #js #자바스크립트 #절댓값 #최댓값 #랜덤 #random #floor
- comprehension
- HTML
- 위코드
- 파이썬
- CSS #HTML #코드
- 티스토리챌린지
- django
- vscode설치
- 오블완
- Today
- Total
당신의 친절한 이웃, 코딩맨
#23 DataBase 의 기초 본문
데이터를 장기 기간 동안 저장 및 보존하기 위해서 데이터 베이스를 사용하는 것이다.
Database에는 크게 관계형 데이터베이스와 비 관계형 database가 있다.
관계형 데이터 베이서(RDBMS, Relatioinal DataBase Management System)
관계형 데이터란 서로 상호 관련성을 가진 형태로 표현한 데이터를 말한다. 대표적인 관께 형 데이터베이스에는 MYSQL과 PostSQL이 있다.
모든 데이터들은 2차원 테이블로 표현된다. 각각의 테이블은 column 과 row로 구성된다.
각 row는 저만의 고유 키(Primary Key)가 있다. 주로 이 primary key를 통해서 해당 로우를 찾거나 인용하게 된다.
각 테이블 끼리의 연결에는 3가지 종류가 있다.
one to one
one to many
many to many
각 테이블의 연결 방법:
Foreign Key(외부키)라는 개념을 사용하여 주로 연결
왜 테이블들을 관계형 데이터베이스로 구성하고 연결하는 걸까?
one to many의 경우 그냥 하냐의 테이블에 고객 정보와 구입한 제품 정보 모두를 저장하면 안 되는 걸까?
하나의 테이블에 모든 정보를 다 넣게 되면, 동일한 정보들이 불필요하게 중복되어 저장된다.
-- 더 많은 디스크를 사용하게 되고, 잘못된 데이터가 저장될 가능성이 높아진다.
예) 고객의 아이디는 동일한데 이름이 틀린 로우들이 있다면 어떻게 해야 하는가? 어떤 이름이 정확한건가?
ACID(Atomicity, Consistency, Isolation, Durability)
- 원자성, 일관성, 고립성, 지속성
- 원자성(Atomicity)은 트랜잭션과 관련된 작업들이 부분적으로 실행되다가 중단되지 않는 것을 보장하는 능력이다. 예를 들어, 자금 이체는 성공할 수도 실패할 수도 있지만 보내는 쪽에서 돈을 빼 오는 작업만 성공하고 받는 쪽에 돈을 넣는 작업을 실패해서는 안된다. 원자성은 이와 같이 중간 단계까지 실행되고 실패하는 일이 없도록 하는 것이다.
- 일관성(Consistency)은 트랜잭션이 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 유지하는 것을 의미한다. 무결성 제약이 모든 계좌는 잔고가 있어야 한다면 이를 위반하는 트랜잭션은 중단된다.
- 고립성(Isolation)은 트랜잭션을 수행 시 다른 트랜잭션의 연산 작업이 끼어들지 못하도록 보장하는 것을 의미한다. 이것은 트랜잭션 밖에 있는 어떤 연산도 중간 단계의 데이터를 볼 수 없음을 의미한다. 은행 관리자는 이체 작업을 하는 도중에 쿼리를 실행하더라도 특정 계좌 간 이체하는 양 쪽을 볼 수 없다. 공식적으로 고립성은 트랜잭션 실행 내역은 연속적이어야 함을 의미한다. 성능 관련 이유로 인해 이 특성은 가장 유연성 있는 제약 조건이다. 자세한 내용은 관련 문서를 참조해야 한다.
- 지속성(Durability)은 성공적으로 수행된 트랜잭션은 영원히 반영되어야 함을 의미한다. 시스템 문제, DB 일관성 체크 등을 하더라도 유지되어야 함을 의미한다. 전형적으로 모든 트랜잭션은 로그로 남고 시스템 장애 발생 전 상태로 되돌릴 수 있다. 트랜잭션은 로그에 모든 것이 저장된 후에만 commit 상태로 간주될 수 있다.
NoSQL 데이터베이스
- 비 관계형 타입의 데이터를 저장할때 주로 사용되는 데이터베이스 시스템
- 관계형 데이터베이스와 다르게 비관계형 이기 때문에 데이터들을 저장하기 전에 정의할 필요가 없다.
- 관계형 데이터베이스는 데이터들을 저장하기 전에 어디에 어떻게 저장할 것인지를 정의해야 한다.
- 즉 테이블을 정의해야 함 (테이블 이름, 테이블과 다른 테이블의 관계, 각 칼럼의 타입 등등)
- 관계형 데이터베이스는 데이터들을 저장하기 전에 어디에 어떻게 저장할 것인지를 정의해야 한다.
- MongoDB, Redis, Cassandra 등이 가장 대표적인 NoSQL 데이터 베이스이다.
SQL(RDBMS) VS NoSQL
SQL
- 장점:
- 관계형 데이터베이스는 데이터를 더 효율적으로 그리고 체계적으로 저장할 수 있고 관리할 수 있다.
- 미리 저장하는 데이터들의 구조(테이블 스키마)를 정의 하므로 데이터의 완전성이 보장된다.
- 트랜잭션(transaction)
- 단점:
- 테이블을 미리 정의해야 함으로 테이블 구조 변화 등에 덜 유연한다.
- 확장성이 쉽지 않다.
- 역시 테이블 구조가 미리 정의되어 있다 보니 단순히 서버를 늘리는 것 만으로 확장하기가 쉽지 않고 서버의 성능 자체도 높여야 한다.
- 서버를 늘려서 분산 저장하는 것도 쉽지 않다.
- Scale up (서버의 성능을 높이는 것)으로 확장성이 됨.
- 정형화된 데이터들 그리고 데이터의 완전성이 중요한 데이터들을 저장하는데 유리하다.
- 예) 전자상거래 정보. 은행 계좌 정보, 거래 정보 등등.
NoSQL
- 장점:
- 테이터 구조를 미리 정의하지 않아도 됨으로 저장하는 데이터의 구조 변화에 유연하다.
- 확장하기가 비교적 쉽다. 그냥 서버 수를 늘리면 됨(scale out)
- 확장하기가 쉽고 테이터의 구조도 유연하다 보니 방대한 양의 데이터를 저장하는데 유리하다.
- 단점:
- 데이터의 완전성이 덜 보장된다.
- 트랜잭션이 안되거나 비교적 불안정하다.
- 주로 비정형화 데이터 그리고 완전성이 상대적으로 덜 유리한 데이터를 저장하는데 유리하다.
- 예) 로그 데이터
위의 ACID부터 NoSQL은 위코드 스택 오버 플로우에서 발최함.
'Today I Learn (TIL)' 카테고리의 다른 글
#25 Python - beautifulSoup으로 코스피 정보를 불러오는 웹 크롤링 (0) | 2020.07.17 |
---|---|
#24 Python 사무 자동화 기본편 - 파일 이름 바꾸기 (0) | 2020.07.16 |
#22 HTTP & RESTful HTTP API - HTTP 프로토콜에 대하여 (0) | 2020.07.12 |
#21 웹의 플로우 - how the web work, network 겉 핥기 (0) | 2020.07.12 |
#20 Python - lambda (0) | 2020.06.29 |