각종꿀팁/IT 자격증

ADsP(데이터분석 준전문가) 1과목 데이터 이해 시험 요약 공부

금융원픽 2024. 10. 27. 23:58

 

이 글의 요약

  • 데이터, 정보, 지식을 통해 최종적으로 지혜를 얻어내는 과정을 피라미드 형태로 나타낸 것이 DIKW 피라미드이다. 예시로는 데이터(Data)는 A마트의 연필 가격은 100원, B마트의 연필 가격은 200원이다. 정보(Information)는 A마트의 연필 가격이 더 싸다. 지식(Knowledge)은 상대적으로 저렴한 A마트에서 연필을 사야 겠다. 지혜(Wisdom)는 A마트의 다른 상품들도 B마트보다 저렴할 것으로 판단한다.
  • 데이터베이스(DataBase)란 동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합이다. 데이터베이스 관리시스템(DataBase Management System)이란 데이터베이스를 조작하는 별도의 소프트웨어로, 데이터베이스를 구축하는 틀을 제공하고, 효율적으로 데이터를 검색하고 저장하는 기능을 제공한다. 또한 응용 프로그램들이 데이터베이스에 접근할 수 있는 인터페이스를 제공하고, 장애에 대한 복구 기능, 사용자 권한에 따른 보안성 유지 기능 등을 제공한다.
  • 데이터에 관한 각종 용어에는 OLTP, OLAP, Schema, Instance, CRM, SCM, ERP, BI, BA, EAI, DW, EDW, 블록체인 등이 있다.

아래에서 자세히 확인하세요▼

 

ADsP(데이터분석 준전문가) 1과목 데이터 이해 시험 요약 공부

 

ADsP시험접수

 


목차


데이터(Data)

데이터는 객관적 사실이라는 존재적 특성과 동시에 추론, 예측, 전망, 추정을 위한 근거로 기능하는 당위적 특성을 갖는다. 데이터는 다른 객체와의 상호관계 일 때 가치를 갖는다. 다만 개별 데이터도 중요하기 때문에, 개별 데이터가 중요하지 않다는 것은 오답의 한 유형이다.

데이터는 정성적 데이터와 정량적 데이터로 나뉜다. 정성적 데이터는 언어, 문자 등 형태와 형식이 정해져 있지 않고, 비정형 데이터 형태로 저장되어 분석에 시간과 비용이 필요하고, 숫자나 금액으로 환산할 수 없는 것을 말한다. 정량적 데이터는 수치, 기호, 도형으로 표시되고 데이터의 양이 증가하더라도 저장, 분석이 용이하고, 숫자나 금액으로 환산 가능하다.

데이터 지식경영의 핵심 이슈에는 암묵지와 형식지가 있다. 암묵지란 학습과 체험을 통해 개인에게 습득되어 있지만 겉으로는 드러나지 않는 지식을 말하며, 개인적인 노하우가 대표적인 예시이다. 형식지란 교과서, 매뉴얼, 비디오, DB와 같이 형상화된 지식을 의미하며 지식의 전달과 공유가 쉽다.

암묵지가 형식지의 상호 작용에는 네 가지 개념이 있다. 암묵지 지식 노하우를 다른 사람에게 알려주는 공통화(Socialization), 암묵지 지식 노하우를 책, 교본 형식으로 전환하는 표출화(Externalization), 책과 교본에 자신이 알고 있는 새로운 지식을 추가하는 연결화(Combination), 만들어진 책과 교본을 보고 다른 직원의 암묵적 지식을 습득하는 내면화(Internalization).

데이터, 정보, 지식을 통해 최종적으로 지혜를 얻어내는 과정을 피라미드 형태로 나타낸 것이 DIKW 피라미드이다. 예시로는 데이터(Data)는 A마트의 연필 가격은 100원, B마트의 연필 가격은 200원이다. 정보(Information)는 A마트의 연필 가격이 더 싸다. 지식(Knowledge)은 상대적으로 저렴한 A마트에서 연필을 사야 겠다. 지혜(Wisdom)는 A마트의 다른 상품들도 B마트보다 저렴할 것으로 판단한다.

 

데이터 유형 분류

데이터 유형 특징 데이터 종류
정형데이터 RDBMS의 고정된 필드에 저장.

데이터 스키마 지원.
RDB, 스프레드시트
반정형데이터 데이터 속성인 메타데이터를 가지며, 일반적으로 스토리지에 저장되는 데이터 파일. HTML, JSON, 웹문서, 센서 데이터
비정형데이터 형태와 구조가 복잡한 이미지, 동영상 같은 멀티미디어 데이터 소셜 데이터, 문서 이미지, 오디오, 비디오

 

목차로 올라가기▶

반응형

데이터베이스(DataBase), 데이터마트(Data Mart), 데이터웨어하우스(Data Warehouse)

 

데이터베이스(DataBase)

데이터베이스(DataBase)란 동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합이다. 데이터베이스 관리시스템(DataBase Management System)이란 데이터베이스를 조작하는 별도의 소프트웨어로, 데이터베이스를 구축하는 틀을 제공하고, 효율적으로 데이터를 검색하고 저장하는 기능을 제공한다. 또한 응용 프로그램들이 데이터베이스에 접근할 수 있는 인터페이스를 제공하고, 장애에 대한 복구 기능, 사용자 권한에 따른 보안성 유지 기능 등을 제공한다.


데이터베이스(DB) 비교

구분 SQL 데이터베이스(RDBMS) NoSQL 데이터베이스
데이터 모델 관계형 모델은 데이터를 행과 열로 구성된 테이블로 정규화. 키-값, 문서, 그래프 등 성능과 규모 확장에 최적화된 다양한 데이터 모델을 제공함.
최적의 워크로드 관계형 데이터베이스는 일관성이 뛰어난 온라인 트랜잭션 프로세싱(OLTP) 애플리케이션을 위해 설계되어 온라인 분석 프로세싱(OLAP)에 적합함. NoSQL 데이터베이스는 낮은 지연 시간의 애플리케이션을 포함한 수많은 데이터 액세스 패턴에 맞도록 설계됨.

NoSQL 검색 데이터베이스는 반정형 또는 비정현 데이터에서 분석을 위해 설계됨.
특징 관계형 데이터를 저장하거나 수정하고 관리할 수 있게 해주는 데이터베이스.

SQL 문장을 통하여 데이터베이스의 생성, 수정 및 검색 등 서비스를 제공.
비관계형(비정형) 데이터베이스 관리 시스템.

빅데이터 분산처리 및 저장기술과 함께 발달된 분산 데이터베이스 기술로 확장성 및 가용성 제공.

대용량 처리와 대규모의 수평적 확장성 제공.

 

RDBMS 와 ODBMS 비교

구분 관계형 데이터베이스(RDBMS) 객체지향 데이터베이스(ODBMS)
데이터 타입 문자, 숫자, 날짜의 단순한 정보 타입만 지원. 사용자 정의 타입 및 비정형 복합 정보 타입 지원.
주된 장점 오랜기간에 걸쳐 검증된 시스템 안정성과 대규모 정보 처리 성능. 복합한 정보 구조의 모델링 가능.
주된 단점 제한된 형태의 정보만 처리 가능. 복잡한 정보 구조의 모델링이 어려움. 기본적인 데이터베이스 관리 기능에서 안정성 및 성능의 검증이 미비.

 

데이터베이스 설계 순서는 요구조건 분석, 개념적 설계(E-R 모델), 논리적 설계(테이블 설계), 물리적 설계(데이터 구조화) 순이다.

 

데이터 마트(Data Mart)

데이터 마트는 데이터웨어하우스의 한 부분이며 데이터를 꺼내 사용하제엑 제공하는 역할을 한다. 특정한 조직, 팀에서 사용하는 것을 목적으로 한다.

 

데이터 웨어하우스(Data Warehouse)

데이터웨어하우스 특징은 데이터의 주제지향성, 통합성, 시계열성, 비휘발성이다.

 

목차로 올라가기▶


데이터에 관한 각종 용어

온라인 트랜잭션 프로세싱(OLTP : On-Line Transaction Processing) 이란 네트워크상의 여러 이용자가 실시간으로 데이터베이스의 데이터를 갱신하거나 조회하는 등의 단위작업을 처리하는 방식이다. 예를 들어 은행에서 수많은 입출금 등이 일어날 때 데이터를 갱신 및 조회를 하게 된다.

온라인 분석 프로세싱(OLAP : On-Line Analytic Processing) 이란 정보 위주의 처리분석을 의미하며 의사결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술이다. 예를 들어 판매 추이, 구매성향 파악, 재무회계 분석 등을 하는 것을 말한다.

스키마(Schema)란 데이터베이스의 구조와 제약조건을 기술하며, 인스턴스(Instance)는 특정 시점의 데이터베이스 내용을 말한다.

CRM(Customer Relationship Management) 은 선별된 고객으로부터 수익을 창출하고 장기적인 고객 관계를 가능케 함으로써 보다 높은 이익을 창출할 수 있는 솔루션이다.

SCM(Supply Chain Management) 은 제조, 물류, 유통업체 등 유통 공급망에 참여하는 모든 업체가 협력을 바탕으로 정보기술을 활용, 재고를 최적화하기 위한 솔루션이다.

ERP(Enterprise Resource Planning, 전사적 자원관리) 란 제조업을 포함한 다양한 비즈니스 분야에서 생산, 구매, 재고, 주문, 공급자와의 거래, 고객서비스 제공 등 주요 프로세스 관리를 돕는 여러 모듈로 구성된 통합 솔루션이다.

BI(Business Intelligence) 란 데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구이다.

BA(Business Analytics) 란 소프트웨어로 데이터를 분석해 미래를 예측하거나(예측 분석), 특정 접근법을 적용했을 때 발생할 수 있는 일을 내다보는(처방적 분석) 기술의 도움을 받는 과정이다. 그래서 BA는 고급분석(advanced analytics) 이라고도 불린다.

EAI(Enterprise Architecture Integration) 란 기업 내의 ERP, CRM, SCM 시스템이나 인프라넷 등의 시스템 간에 상호 연동이 가능하도록 통합하는 솔루션이다.

EDW(Enterprise Data Warehouse) 란 기존 DW(Data Warehouse)를 전사적으로 확장한 모델인 동시에 BPR, CRM, BSC 같은 다양한 분석 애플리케이션들을 위한 원천이됨. 기업 리소스의 유기적 통합, 다원화된 관리체계 정비, 데이터의 중복 방지 등을 위해 시스템을 재설계하는 것을 말한다.

블록체인(Blockchain)은 데이터 분산 처리 기술로 네트워크에 참여하는 모든 사용자가 모든 거래내용 등의 데이터를 분산, 저장하는 기술을 말한다.

 

목차로 올라가기▶

참고자료 : ADsP한권으로끝내기(김계철 지음)


<함께보면 좋은 글>

 

ADsP(데이터분석 준전문가) 자격 안내, 시험 일정, 공부 방법

이 글의 요약ADsP(데이터분석 준전문가) 란 데이터 이해에 대한 기본지식을 바탕으로 데이터분석 기획 및 데이터분석 등의 직무를 수행하는 실무자이다.시험과목은 데이터 이해, 데이터분석 기

jomosi.tistory.com

 

ENA, ENA PLAY, ENA DRAMA 편성표 및 채널번호

ENA 채널은 Entertainment DNA 의 약자로 KT 그룹 계열사인 skyTV(스카이라이프) 가 운영하는 채널입니다. ENA 외에 ENA PLAY, ENA DRAMA, ENA STORY 등 다양한 채널을 주제에 맞게 방영하고 있으며 최근에는 오은

jomosi.tistory.com

 

트위터 아이디 찾기

이 글의 요약 회원가입을 한 후에 이메일을 입력한 후 "이미 등록된 이메일입니다." 라는 문구가 뜨면 해당 이메일 주소로 트위터 아이디 찾기 새로운 이메일로 회원가입을 한 후에 @twittersupport

jomosi.tistory.com

 

알바천국 이력서 양식 다운

▼아르바이트 이력서 양식 다운로드(doc 파일, hwp 파일)▼ 아래에서 자세히 확인하세요▼ 알바천국, 알바몬, 사람인, 잡코리아 등 인력 채용 플랫폼이 경쟁하며 시장에서 활발하게 활동하고 있습

jomosi.tistory.com

 

반응형