본문 바로가기

분류 전체보기271

[SQLD] SQL 비교연산자(관계, 논리), IN, OR, AND, NOT, Exists 이번 포스팅에서는 SQL의 연사자들에 대해 알아보도록 하겠습니다. SQL은 관계, 논리, IN, OR, AND, NOT, Exists 등 연산자를 사용할 수 있는데요. 아래 연산자를 통해 WHERE절에서 반환되는 데이터 행을 제한 한다고 생각하면 됩니다. 크게 관계 연산자와 논리 연산자로 구분할 수 있습니다. 종류 예시 관계 연산자 = SELECT * FROM TB_PROD WHERE PROD_UNIT_AMT = 100000; !=, ^=, SELECT * FROM TB_PROD WHERE PROD_UNIT_AMT != 100000; >, 100000; >=, 2023. 11. 16.
[SQLD] SQL의 이해 및 구문 이번 포스팅에서는 데이터베이스에서는 빼놓을 수 없는 SQL에 대해 알아보도록 하겠습니다. 우리가 데이터베이스를 설치하고 접속했을 때 가장 먼저 해 볼 수 있는 것이 SQL 쿼리를 실행하는 것입니다. 그 만큼 필수로 알아야 한다는 이야기입니다. SQL이란 SQL은 Structured Query Language의 약자로 데이터베이스를 관리하고 조작하기 위해 특별히 설계된 프로그래밍 언어입니다. ANSI(미국 표준 협회)에서 제정한 관계형 데이터베이스를 위한 표준 언어라고 할 수 있습니다. SQL을 통해서만 RDBMS안에 있는 데이터를 얻을 수 있습니다. 기본 원칙은 모든 SQL 문은 세미콜론(;)에 의해 종료됩니다. SQL은 대소문자를 구별하지 않습니다. SQL 구문의 종류 DML(Data Manipulat.. 2023. 11. 15.
하둡과 빅데이터는 무슨 관계일까? 이번 포스팅에서는 하둡이 왜 나왔는지? 그리고 하둡 에코시스템은 무엇인지 그 특징들을 알아보도록 하겠습니다. 사실 하둡 에코시스템이라고 하면 그 안에 너무 많은 솔루션들이 있어 이번 포스팅에서 모두 다루기는 힘듭니다. 이번에는 데이터를 저장하는 저장소 관점에서 살펴보도록 하겠습니다. Hadoop의 출현 배경 2000년대에 오면서 문자, 음성, 영상 등 비정형 데이터 급증하기 시작합니다. 이유는 스마트폰 확산이 가속하시켰다고 볼 수 있습니다. 2007년 6월, 스티브잡스가 아이폰을 처음 공개하면서 그 시장은 더욱 커지기 시작합니다. 그와 발맞춰 SNS, 쿠폰, 광고, GPS 위치정보, 비콘 등에 데이터도 꾸준히 증가합니다. 그 이유는 멀티미디어 콘텐츠 사용에 의한 데이터 증가였죠. 아래의 그래프 처럼 데이.. 2023. 11. 14.
인메모리(In-memory) DB 특징과 종류 비교 『 '데이널'의 컨텐츠에 포함된 정보는? 』 이번 포스팅에서는 인메모리(In-memory) 데이터베이스에 대해 알아보도록 하겠습니다. 인메모리 DB가 출현한 배경은 기술적 측면과 비즈니스 측면으로 나눠서 생각해 볼 수 있습니다.    인메모리 데이터베이스 배경첫째, 기술적 측면기술적으로 64bit OS 환경이 일반화되면서 부터 인메모리 시장은 시작됐습니다. 아무래도 메모리 가격이 지속적으로 하락하면서 메모리 사용의 제약사항 없어졌기 때문이죠. 과거보다는 메모리에 활용에 긍정적인 환경이 됐습니다. 둘째, 비즈니스적 측면비즈니스 요구사항으로 신속한 의사결정 및 안정적 서비스  Needs가 나오기 시작했습니다. 방법은 메모리에서 처리해서  빠르게 결과를 내는 방법밖에는 없었죠. 결국 이러한 수요로 인메모리 데.. 2023. 11. 13.
머신러닝과 딥러닝의 차이는 무엇일까요? 많은 사람들이 머신러닝과 딥러닝은 비슷하다고 생각합니다. 하지만 어떻게 다른지 정확히 설명하는 사람은 드믈죠. 보통 AI > 머신러닝 > 딥러닝이라는 공식으로 설명하는게 일반적이죠. 이 말이 틀린 설명은 아니지만 차이점에 대한 궁금증은 여전히 남아있습니다. 이번 포스팅에서는 머신러닝과 딥러닝의 핵심 차이점을 알아보고 어떻게 두 기술이 서로 보완하면서 지금의 기술을 발전 시키고 있는지 살펴보겠습니다 개인적인 경험을 이야기해 보겠습니다. 머신러닝을 익숙하게 사용할 때쯤 딥러닝이 훨씬 정확도가 높다는 이야기가 들려왔습니다. 소문으로 들었던 기술이라 어렵게만 느껴졌습니다. 하지만 어느세 딥러닝은 가장 강력한 알고리즘으로 부상했습니다. 그 계기가 딥마인드의 알파고와 이세돌의 대결이었죠. 그 순간, 더 이상 딥러닝.. 2023. 11. 11.
NoSQL의 특징 - RDBMS와 어떻게 다를까? 『 '데이널'의 컨텐츠에 포함된 정보는? 』NoSQL은 어떤 점이 rdbms와 다를까요? 이글에서는 NoSQL의 등장 배경과 그 특징에 대해 알아보시죠. 결론부터 말하면 NoSQL은 비관계형, 분산, 오픈소스, 수평 확장성이 주요 특징을 가지고 있습니다.   "No! SQL"이 아니라 "Not Only SQL"이라고 하죠. SQL을 사용하지 않는다는 것이 아니라 SQL만 의존하지 않는다는 의미입니다. 오해하시면 안됩니다. 그럼 등장 배경부터 살펴보겠습니다.  등장 배경정통적인 관계형 데이터베이스(rdbms) 생태계를 어느순간 클러스터가 위협하기 시작했습니다. 여기서 클러스터란 여러 대의 컴퓨터들이 연결되어 하나의 시스템처럼 동작하는 컴퓨터들의 집합을 말합니다. 바로 Scale Out이 가능한 데이터베이스.. 2023. 11. 10.
Sybase IQ 특징 및 장단점 - Column-wise, Bit-wise Index 이번 포스팅에서는 Sybase IQ 에 대해서 알아보도록 하겠습니다. Sybase IQ는 DW 전용 데이터베이스 입니다. 처음 Data Warehouse 프로젝트를 할 때 개인적으로 기존 오라클 대비 얼마나 빠를까 의심했는데요. 통계적 쿼리는 상대도 안될만큼 빨리나오는 것을 보고 놀랐습니다. Sybase IQ의 특징을 보면 왜 그런 결과가 나왔느지 이해가 가는데요. 우선 DW 전용 데이터베이스의 출현 배겨을 알아보고, Sybase IQ의 특징 및 장단점을 살펴보겠습니다. 출현 배경 1. 다양한 분석 요구사항 증가 업무 시스템의 일반적인 통계 데이터가 아니라 다차원 분석, 시계열 분석에 대한 요구사항이 늘어났습니다. 단순한 데이터의 저장고가 아니라 많은 데이터를 다차원적으로 신속하게 분석하여 의사결정하는 .. 2023. 11. 9.
Rule-base 와 머신 러닝은 어떻게 다를까? 『 '데이널'의 컨텐츠에 포함된 정보는? 』 여러분은 Rule-based Learning과 Machine Learning(머신 러닝) 어떻게 다르다고 생각하시나요? 이 두 기법 간에는 몇 가지 중요한 차이점이 존재합니다. 이번 포스팅에서는 내가 왜 두 분석 기법의 차이점을 이야기하고 싶었는지에 대한 배경과 각각의 특성과 장단점을 살펴보겠습니다. 배경사실 이 글을 쓰게 된 계기는 얼마 전 연구사업 프로젝트 평가에서 있었던 일 때문입니다. 평가위원이 프로젝트 결과물을 보고 "Rule-base로 하든 머신러닝으로 하든 같은 것 아니냐?"는 질문이 발단이 되었습니다. 어디서부터 설명해야 할지 무척 고민스럽더라고요. 하지만 평가위원이 왜 그런 말을 했는지 약간 짐작은 갔습니다. Big data 초창기에는 데이터 .. 2023. 11. 8.
MySQL 아키텍처 및 특징 - Scale Out, Sharding(샤딩) 이번 포스팅에서는 데이터베이스 종류 시리즈 두번째 MySQL에 대해 알아보도록 하겠습니다. MySQL을 처음 사용하게 된것은 내 개인 홈페이지 데이터베이스였든데요. 그 시점에 오라클은 뭔가 무겁고 가벼운 데이터베이스가 필요했습니다. 그러다 MySQL이 가장 적합한 데이터베이스라는 것을 알게 되었습니다. 그럼 MySQL 출현 배경과 아키텍처, 특징에 대해 살펴보도록 할까요.    MySQL이란?MySQL의 출발은 오픈소스 데이터베이스였습니다. 어느 순간 세상에서 많이 사용하는 인기있는 플랫폼이 되자 오라클에서 정식으로 인수하게 됩니다. 표준 데이터베이스 언어인 SQL(Structured Query Language)을 사용하는 오픈소스 RDBMS가 등장하게 되었던 겁니다. 한때는 Oracle, MS SQL .. 2023. 11. 8.