본문 바로가기

분류 전체보기271

리눅스 쉘 스크립트(Shell Script) 쉬운 설명 이번 포스팅에서는 리눅스에서 사용하는 쉘 스크립트에 대해 설명드리겠습니다. 리눅스는 보통 CLI 환경에서 다양한 작업을 수행합니다. 그러다 보니 여러 명령어를 반복 실행하거나 복잡한 작업을 자동화해야 할 경우가 발생합니다. 그 때 필요한 도구가 리눅스 쉘 스크립트라는 프로그램입니다. 이 글에서는 리눅스 쉘 스크립트의 기본 개념, 작성 방법, 실행 방법에 대한 예시를 들어 알아보겠습니다. 쉘 스크립트란? Shell Script는 리눅스 운영 체제에서 사용되는 명령어와 프로그램을 시퀀스로 나열한 스크립트 파일입니다. 스크립트라고 부르는 것처럼 텍스트 파일로 작성합니다. 실행파일을 특별히 만들 필요없이 Script를 실행하면 파일에 포함된 명령어가 순차적으로 실행됩니다. 이런 방법으로 우리들은 복잡한 작업을 .. 2023. 11. 7.
오라클(Oracle) 관계형 DB 특징, MS SQL Server 아마도 여러분은 관계형 데이터베이스의 가장 많이 사용되고 있을 건데요. 그중에서도 오라클이 가장 익숙하실 겁니다. 오늘은 대표적인 관계형 DB인 오라클, My SQL Server 살펴보도록 하겠습니다. 오라클의 특징이 곧 관계형 데이터베이스의 특징이라 해도 과언은 아닙니다. 그 만큼 많은 사람들이 사용했고 레퍼런스도 많다는 장점이 있습니다. 처음에 데이터베이스에 입문할 때도 Oracle로 하는 경우가 많습니다.    관계형 데이터베이스 특징1. 2차원 테이블로 데이터 표현관계형 db의 테이블을 가장 쉽게 이해하는 방법은 엑셀(excel)과 비슷하다고 생각할 수 있습니다. 엑셀 창을 열면 행과 열로 표현할 수 있게 되어 있습니다. 처음에 SQL을 배우면 아래 그림처럼 데이터를 출력하는 방법부터 배웁니다. .. 2023. 11. 7.
데이터베이스(Database) 종류, DB 역사는 어떻게 달라졌나? [ 목차 ] 데이터베이스의 종류라고 하면 계층형(Hierarchical), 네트워크형(Network), 관계형(Relational)과 같은 초기 개념부터 다룰 수도 있는데요. 이는 데이터베이스의 원론적인 분류입니다. 이 세 가지 유형의 데이터베이스의 선택은 관계형 데이터베이스, 즉 rdbms로 결론이 났다고 볼 수 있습니다. 현재도 많은 rdbms가 상용 데이터베이스로 사용되고 있기 때문이죠. 그리고 이후에 더 다양한 데이터베이스의 종류가 나오고 발전해 왔습니다.     데이터베이스는 어떻게 달리졌나?이 글에서는 데이터베이스의 그동안의 변천사를 알아보고, 어떤 needs에 의해 새로운 데이터베이스들이 탄생하게 되었는지 한 번에 살펴보겠습니다. 대부분은 관계형 데이터베이스만 익숙하실 테지만 요즘은 기업과 .. 2023. 11. 6.
데이터베이스 아키텍처 구성 요소 및 작동 원리 이번 포스팅에서는 데이터베이스의 일반적인 구성 요소를 살펴보겠습니다. 그리고 우리가 SQL 쿼리를 수행했을 때 어떤 방식으로 동작하는지에 대해도 알아보도록 하겠습니다. 데이터베이스 구성 요소 데이터베이스 아키텍처는 DBMS의 물리적인 구성과 동작하는 방식을 말합니다. 데이터베이스 구성요소는 메모리, 프로세스, 데이터베이스(파일)로 구분할 수 있습니다. 1. 메모리 데이터 처리를 더 빠르게 작업하기 위한 공간. 컴퓨터에서도 프로그램을 실행하면 메모리 공간에서 작하는 것과 같은 원리로 DB에서도 메모리에서 작업을 합니다. 2. 프로세스 데이터베이스에서 메모리, CPU, 데이터, 로그(Log) 등 컨트롤하기 위한 프로세스를 말함. 오라클 기준으로 8개 정도의 프로세스가 존재합니다. 예를 들어, 데이터파일에 데.. 2023. 11. 3.
데이터베이스(Database)는 어떤 특징이 있는가? 데이터베이스는 어떤 필요에 의해서 만들어졌을까요? 그 필요에 따른 몇가지 특징들이 있습니다. 관계형 데이터베이스 시스템( RDBMS)의 역사는 1970년대로 거슬러 올라갑니다. 데이터 관리의 새로운 접근 방식으로 처음 소개었죠. 데이터베이스가 나오기 전에는 어떻게 관리했을지 생각해 보신 적 있으신가요? 데이터베이스란 무엇인지 보면서 한번 같이 생각해 보시죠. 데이터베이스란 데이터베이스는 회사 내에서 다수의 사용자들이 데이터를 공유해 사용할 수 있도록 통합해서 저장한 데이터의 집합체라고 할 수 있습니다. 아마도 데이터베이스가 없었을 당시에는 그냥 서류나 문서로 데이터를 관리했을 것입니다. 캐비닛에는 서류를 모아 수많은 파일 박스에 담아 놓았기 때문에 찾기도 어려웠을 것이라는 생각이 되는데요. 사람들은 어떻.. 2023. 11. 2.
데이터 표준화 - 표준 코드, 코드 유형, 코드 에러 사례 이번 포스팅에서는 데이터 표준화 중에 표준 코드에 대해서 알아보도록 하겠습니다. 코드는 시스템을 개발하는데 있어서 중요한 역할을 합니다. 예를 들어, 코드를 데이터화하지 않고 하드코딩을 한다면 변경에 대한 유지보수가 발생할 경우 꼭꼭 숨겨져 있어서 찾기가 어렵습니다. 표준코드 구성 여기서 말하는 코드는 남자, 여자와 같이 구분하여 관라할 수 있는 값을 말합니다. 항상 같은 형태, 유형, 구분으로 들어오기 때문에 처음부터 코드로 정의하여 관리하는 것입니다. 이렇게 코드를 정의하면 해당 코드를 위해 grouping을 통해 통계 분석을 할 수 도 있습니다. 또 데이터 분석의 feature로 활용될 수도 있습니다. 코드 유형 1. 일반코드 공통코드 테이블에서 통합되어 관리되는 코드를 말합니다. 우리가 코드를 관.. 2023. 10. 31.
데이터 표준화 - 표준단어, 도메인, 표준용어 이번 포스팅에서는 데이터 표준화의 구성요소인 표준단어, 도메인, 표준용어의 관계에 대해 알아보도록 하겠습니다. 각각의 의미를 이해하고 실제 시스템에 표준화 적용시 어떻게 진행해야 하는지를 개념 파악이 필요합니다.    데이터 표준화 관계도1. 표준단어표준단어는 용어를 구성하는 최소 단위입니다. 의미적으로 더 이상 쪼개지지 않는 가장 작은 단위의 형태소(단어)를 말합니다.2. 표준도메인도메인은 데이터의 형식 및 길이를 데이터의 특성에 따라 정형화한 명칭입니다. 각각의 용어는 하나의 표준 도메인을 가집니다. 3. 표준용어표준단어의 조합으로 구성된 용어가 표준용어입니다. 정형화된 데이터의 타입과 길이를 갖는 통일된 하나의 속성(컬럼) 명칭을 의미합니다.   그림에서 주제어로 표현한 것은 업무명이나, 용어의 성.. 2023. 10. 30.
데이터 표준화 필요성 및 기대효과 이번 포스팅에서는 데이터 표준화에 대해 알아보도록 하겠습니다. 데이터베이스 영역의 스터디이기 때문에 데이터 분석에서 데이터 표준화(standardization)와는 다른 내용입니다. 데이터의 구조인 테이블, 컬럼 등의 표준화를 말합니다.  데이터 표준화는 개발 초기부터 업무를 파악하고 진행하게 됩니다. 보통 데이터 업계에서는 표준화를 신입 직원들에게 맡깁니다. 2~3일의 교육만으로 개념을 잡고 시작할 수 있기 때문이죠. 부족한 부분은 시니어 모델러들이 알려주는 방식으로 진행합니다. 사실 제대로 한다면 경험있는 표준화 담당자가 고객과 인터뷰를 통해 전사의 단어와 용어를 제대로 정의해야 합니다. 하지만 리소스와 기간의 한계 때문에 어쩔수 없는 상황입니다. 표준화되지 않았을 때 문제점만약 관리하는 시스템이 데.. 2023. 10. 30.
리눅스 리다이렉션(IO Redirection) 개념 이번 포스팅에서는 리눅스의 리다이렉션 개념에 대해 알아보도록 하겠습니다. 정확히 말하면 Input Output Redirection의 약자로 리눅스 환경에서 입력과 출력의 방향에 대한 개념입니다. IO Redirection이란 보통 리눅스는 UI 환경보다는 CLI(command line interface)에서 사용하게 됩니다. CLI 환경에서 명령어를 통해 터미널에 입력한 결과를 다른 방식으로 입출력을 하는 방법을 IO Redirection 이라합니다. 예를들어, 터미널에서 "ls -l"을 입력하면 터미널에 현재 디렉토리의 목록을 출력하는 것은 "standard output” 방법으로 터미널에 표시하게 되는 것입니다. Redirection 3가지 Standard Output, Standard Input,.. 2023. 10. 27.