정보처리기사 실기 3과목

정보처리기사 실기 3과목

데이터 입출력 구현

챕터1: 논리 데이터 저장소 확인

< 기출 문제 >

1. 다음은 데이터 모델링 절차이다. 절차에 맞도록 보기에서 찾아 채우시오.

A 물리적 데이터 모델링

B 개념적 데이터 모델링

C 논리적 데이터 모델링

요구 사항 분석 -> 개념적 -> 논리적 -> 물리적

2. 릴레이션 A, B가 있을 때 릴레이션 B 조건에 맞는 것들만 릴레이션 A에서 튜플을 꺼내 프로젝션하는 관계대수는 무엇인가?

디비전 ( 나누기 )

셀렉트

릴레이션 R 에서 조건을 만족하는 튜플 반환

프로젝트

릴레이션 R에서 주어진 속성들의 값으로만 구성된 튜플 반환

조인

공통 속성을 이용해 R과 S의 튜플들을 연결해 만들어진 튜플 반환

디비전

릴레이션 S의 모든 튜플과 관련있는 R의 튜플 반환

3. 이상 현상의 종류 3가지를 쓰시오.

삽입 이상 / 삭제 이상 / 갱신 이상

4. 비 정규화 의 개념을 쓰시오.

정규화된 엔터티, 속성, 관계에 대해 성능 향상과 개발 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모델링 기법이다.

< 예상 문제 >

1. 다음 괄호 ( ) 안에 들어갈 가장 적합한 용어를 쓰시오.

논리 데이터 모델링의 속성은 ( 1 ), 속성, ( 2 )로 구성된다.

1: 개체

2: 관계

논리 데이터 모델링

개체 / 속성 / 관계

2. 다음에서 설명하는 데이터 모델을 쓰시오.

현실 세계에 존재하는 데이터와 그들 간의 관계를 사람이 이해할 수 있는 형태로 명확하게 표현하기 위해서 가장 널리 사용되고 있는 모델이다.

요구사항으로부터 얻어낸 정보들을 개체, 속성, 관계로 기술한 모델이다.

개체 - 관계 모델

3. 다음은 개체-관계(E-R) 다이어 그램 기호이다. 괄호 ( ) 안에 들어갈 용어를 쓰시오.

개체 - 사각형

( 1 ) - 마름모

( 2 ) - 타원

다중 값 속성 - 이중타원

관계-속성 연결 - 선

1: 관계

2: 속성

4. 다음에서 설명하는 데이터베이스 기법을 쓰시오.

관계형 데이터 모델에서 데이터의 중복성을 제거하여 이상 현상을 방지하고, 데이터의 일관성과 정확성을 유지하기 위해 무손실 분해하는 과정이다.

정규화

5. 다음 그림이 가리키는 데이터베이스 정규화 단계를 쓰시오.

2차 정규화

부분 관계인 <서비스 이름, 서비스 가격> 관계를 별도의 테이블로 두면 부분함수 종속 관계가 제거되어 2차 정규화를 만족한다.

6. 데이터베이스 이상 현상을 서술하시오.

데이터의 중복성으로 인해 릴레이션을 조작할 때 발생하는 비합리적 현상은 이상 현상이다.

7. 정규화 단계 중 BCNF의 개념을 간략히 서술하시오.

모든 결정자가 후보 키가 되도록 하여 결정자 함수 종속성을 제거하는 단계이다.

3차 정규형을 만족하면서 모든 결정자가 후보키 집합에 속한 정규형이다.

3차 정규형으로 해결할 수 없는 이상 현상을 해결할 수 있다.

챕터2: 물리 데이터 저장소 설계

< 예상 문제 >

1. 다음은 모델링 기법에 대한 설명이다. 괄호 ( ) 안에 들어갈 개념을 쓰시오.

( )은/는 논리모델을 적용하고자 하는 기술에 맞도록 상세화해 가는 과정이다.

물리 데이터 모델링

2. 다음은 인덱스 적용 기준과 관련된 수식이다. 어떤 개념에 대한 설명인지 쓰시오.

( 1 / 컬럼 값의 종류) x 100

(컬럼 값의 평균 Row 수 / 테이블의 총 Row 수) x 100

분포도

특정 컬럼의 데이터가 테이블에 평균적으로 분포되어 있는 정도이다.

인덱스로 적정 분포도는 10% ~ 15% 이다.

3. 다음은 인덱스 컬럼 선정 기준이다. 괄호 ( ) 안에 들어갈 용어를 쓰시오.

( 1 )이/가 좋은 컬럼은 단독적으로 생성한다.

자주 조합되어 사용되는 컬럼은 ( 2 )로 생성한다.

1: 분포도

2: 결합 인덱스

4. 관계형 데이터베이스의 인덱스 개념을 간략히 약술하시오.

전체 데이터의 검색 없이 빠르게 조회가 가능하게 한다는 것을 중점으로 작성한다.

검색 연산의 최적화를 위해 데이터베이스 내 열에 대한 정보를 구성한 데이터 구조이다.

5. 다음이 설명하는 파티셔닝 기법은 무엇인지 쓰시오.

연속적인 숫자나 날짜를 기준으로 하는 파티셔닝 기법이다.

손쉬운 관리 기법을 제공하여 관리 시간의 단축이 가능하다.

레인지 파티셔닝(범위 파티셔닝)

해시 파티셔닝

파티션 키의 해시 함수 값에 의한 파티셔닝 기법 / 균등한 데이터 분할이 가능하고 질의 성능이 향상 가능

리스트 파티셔닝

특정 파티션에 저장 될 데이터에 대한 명시적 제어가 가능한 파티셔닝 기법 / 분포도가 비슷하고 데이터가 많은 SQL에서 컬럼의 조건이 많이 들어오는 경우 유용

컴포지트 파티셔닝

범위분할에 이후 해시 함수를 적용하여 재분할 하는 파티셔닝 기법 / 큰 파티션에 대한 I/O 요청을 여러 파티션으로 분산할 수 있음

챕터3: 데이터베이스 기초 활용하기

< 기출 문제 >

1. 데이터 마이닝의 개념에 관해서 서술하시오.

대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술이다.

대규모 데이터에서 의미 있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 기법이다.

< 예상 문제 >

1. 데이터베이스의 개념을 간략히 서술하시오.

다수 인원, 시스템이 사용할 목적으로 통합하여 관리되는 데이터의 집합이다.

2. 다음은 데이터베이스의 종류에 대한 설명이다. 괄호 ( ) 안에 공통으로 들어갈 가장 적합한 용어를 쓰시오.

( )은 데이터를 상하 종속적인 관계로 관리하는 데이터베이스이다.

( )은 데이터에 대한 접근 속도가 빠르지만, 종속적인 구조로 인하여 변화하는 데이터 구조에 유연하게 대응이 어렵다.

계층형 데이터 베이스 관리 시스템(HDBMS)

3. 다음은 DBMS 유형에 관한 설명이다. 다음 괄호 ( ) 안에 들어갈 가장 적합한 용어를 쓰시오.

유형

( 1 ) 키 기반 GET / PUT / DELETE 제공, 메모리 기반에서 성능 우선 시스템 및 빅데이터 처리 가능 DBMS

유니크한 키에 하나의 값을 가지고 있는 형태 EX) Redis, DynamaDB

( 2 ) 값의 데이터 타입이 문서라는 타입을 사용하는 DBMS / 문서 타입은 XML, JSON과 같이 구조화된 데이터 타입으로, 복잡한 계층 구조 표현 가능 EX) MongoDB, Couchbase

( 3 ) 시맨틱 웹과 온돌로지 분야에서 활용되는 그래프로 데이터를 표현하는 DBMS / 노드와 에지로 특징되는 요소 특화 / 노드 간 관계를 구조화하여 저장 EX) Neo4j, AllegroGraph

1: 키-값 DBMS

2: 문서 저장 DBMS

3: 그래프 DBMS

4. 다음은 DBMS 특징에 대한 설명이다. 다음 괄호 ( ) 안에 들어갈 가장 적합한 용어를 쓰시오.

( 1 ) 부적절한 자료가 입력되어 동일한 내용에 대하여 서로 다른 데이터가 저장되는 것을 허용하지 않는 성질

( 2 ) 삽입, 삭제, 갱신, 생성 후에도 저장된 데이터가 변함없이 일정

1: 데이터 무결성

2: 데이터 일관성

데이터 회복성

장애가 발생하였을 시 특정 상태로 복구되어야 하는 성질

데이터 보안성

불법적인 노출, 변경, 손실로부터 보호되어야 하는 성질

데이터 효율성

응답 시간, 저장 공간 활용 등이 최적화되어 사용자, 소프트웨어, 시스템 등의 요구 조건을 만족 시켜야 하는 성질

5. ERD의 개념을 간략히 서술하시오.

ERD : 업무 분석 결과로 도출된 실체(개체)와 개체 간의 관계를 도식화한 다이어그램이다.

6. ER 모델 요소에 대한 설명이다. 다음 괄호 ( ) 안에 들어갈 가장 적합한 용어를 쓰시오.

모델 요소

( 1 ) 사물 또는 사건으로 정의 / ERD에서 사각형으로 표시

( 2 ) ( 1 )이/가 가지고 있는 요소 또는 성질 / ERD에서 타원형으로 표시

1: 개체

2: 속성

7. 괄호 ( ) 안에 들어갈 용어를 쓰시오.

빅데이터 기술 중에 ( 1 )은 대용량 데이터의 집합을 처리하는 응용 프로그램에 적합하도록 설계된 분산 파일 시스템이다.

구글에서 대용량 데이터 처리를 분산 병렬 컴퓨팅에서 처리하기 위한 목적으로 제작하여 2004년에 발표한 소프트웨어 프레임 워크는 ( 2 ) 이다.

1: HDFS(Hadoop Distributed File System)

2: 맵 리듀스(Map Reduce)

8. 다음은 빅데이터의 특성에 대한 설명이다. 괄호 ( ) 안에 들어갈 빅데이터 특성에 대해 쓰시오.

데이터의 양

페타 바이트 수준의 대규모 데이터

데이터의 ( )

정형, 비정형, 반정형의 데이터

빅데이터 자원 유형에 관련된 특성

데이터의 속도

빠르게 증가하고 수집되며, 처리되는 데이터

다양성(Variety)

로그, 소셜, 위치 등 데이터 유형이 다양해지는 것을 의미하는 빅데이터의 특성

9. NoSQL(Not Only SQL)의 개념에 대해 서술하시오.

전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어로 데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인 연산을 사용할 수 없으며, 수평적으로 확장이 가능한 DBMS이다.

10. 다음은 NoSQL의 특성인 BASE에 대한 설명이다. 괄호 ( ) 안에 들어갈 용어를 쓰시오.

Basically Available

언제든지 데이터는 접근할 수 있어야 한다는 속성 / 분산 시스템이기 때문에 항상 가용성 중시

( )

노드의 상태는 내부에 포함된 정보에 의해 결정되는 것이 아니라 외부에서 전송된 정보를 통해 결정되는 속성 / 특정 시점에서는 데이터의 일관성이 보장되지 않음

Eventually Consistency

일정 시간이 지나면 데이터의 일관성이 유지되는 속성 / 일관성을 중시하고 지향

Soft-State

11. Key 안에 (Column, Value) 조합으로 된 여러개의 필드를 갖는 NoSQL의 유형에 대해 쓰시오.

Column Family Data Store

12. 온톨로지(Ontology)의 개념에 대해 서술하시오.

실세계에 존재하는 모든 개념과 개념들의 속성, 그리고 개념간의 관계 정보를 컴퓨터가 이해할 수 있도록 서술해 놓은 지식베이스이다.

13. 데이터 마이닝의 주요 기법이다. 괄호 ( ) 안에 들어갈 용어는?

분류 규칙

과거 데이터로부터 특성을 찾아내어 분류 모형을 만들어 이를 토대로 새로운 레코드의 결과 값을 예측하는 기법

( 1 ) 규칙

데이터 안에 존재하는 항목들 간의 종속 관계를 찾아내는 기법 / 제품이나 서비스의 교차판매, 매장 진열, 사기 적발 등 다양한 분야에서 활용

( 2 ) 규칙

( 1 ) 규칙에 시간 관련 정보가 포함된 형태의 기법 / 개인별 트랜잭션 이력 데이터를 시계열적으로 분석하여 트랜잭션의 향후 발생 가능성 예측

1: 연관 규칙

2: 연속 규칙

14. 텍스트 마이닝 의 개념에 대해 서술하시오.

비정형/반정형 데이터에 대하여 자연어/문서 처리기술을 적용하여 의미 있는 정보를 추출한다.

15. DBMS의 개념을 약술하시오.

DBMS는 데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제 등의 기능을 지원하는 소프트웨어다.

< 단원종합문제 >

1. 다음은 논리 데이터 모델링 속성이다. 괄호 ( ) 안에 들어갈 용어를 쓰시오.

( 1 ) - 관리할 대상이 되는 실체

( 2 ) - 관리할 정보의 구체적 항목

관계 - 개체 간의 대응 관계

1: 개체

2: 속성

2. 다음 내용이 설명하는 데이터베이스 정규화 단게에 대해서 쓰시오.

모든 결정자가 후보키가 되도록 하여 결정자 함수 종속성을 제거하는 단계이다.

보이스 / 코드 정규형 (BCNF)

3. 다음 내용이 설명하는 데이터베이스 정규화 단게에 대해서 쓰시오.

테이블 내의 속성값은 원자값으로 구성하는 단계이다

이메일 주소가 속성에 2개 이상 가지고 있는 경우 원자값이 아니기 때문에 속성 1개만 가지도록 구성한다.

1정규형(1NF)

4. 다음 그림이 가리키는 파티션(파티셔닝)의 유형을 쓰시오.

해시 파티셔닝

해시 값에 의한 균등한 데이터 분할 파티셔닝

5. 개체-관계(E-R) 모델의 개념을 간략히 서술하시오.

현실에 존재하는 데이터와 그들 간의 관계를 사람이 이해할 수 있는 형태로 명확하게 표현하기 위한 모델로 요구사항으로부터 얻어낸 정보들을 개체, 속성, 관계로 기술한 모델

6. 파티션 종류 중 레인지 파티셔닝 의 개념을 간략히 약술하시오.

연속적인 숫자나 날짜를 기준으로 하는 파티셔닝 기법

7. 다음은 데이터베이스 정의이다. 빈칸에 알맞은 용어를 쓰시오.

데이터베이스는 ( 1 ), 저장된 데이터, ( 2 ), 공용 데이터이다.

1: 통합

2: 운영

8. 다음은 데이터베이스 특성이다. 빈칸에 알맞은 용어를 쓰시오.

데이터베이스 특성에는 실시간 접근성, ( 1 ), 동시공용, ( 2 )이/가 있다.

1: 계속적인 변화

2: 내용 참조

9. 빅데이터의 개념을 간략히 서술하시오.

처리 가능한 데이터 범위를 넘어서는 수십 페타바이트 크기의 비정형 데이터이다.

10. 다음은 빅데이터의 특성에 대한 설명이다. 괄호 ( ) 안에 들어갈 용어를 쓰시오.

( 1 )

페타 바이트 수준의 대규모 데이터 / 빅데이터 분석 규모에 관련된 특성 / 디지털 정보량이 기하급수적으로 폭증하는 것

( 2 )

정형, 비정형, 반정형의 다양한 데이터 / 빅데이터 자원 유형에 관련된 특성 / 로그, 소셜, 위치 등 데이터 유형이 다양해지는 것을 의미

속도

빠르게 증가하고 수집되며, 처리되는 데이터 / 가치 있는 정보활용을 위해 실시간 분석이 중요해지는것을 의미.

1: 양(Volume)

2: 다양성(Variety)

11. NoSQL 의 개념을 간략히 서술하시오.

RDBMS 와 다른 DBMS 지칭하는 용어 테이블 스키마가 필요하지 않고 조인 연산을 사용할 수 없고 수평적으로 확장이 가능

12. NoSQL의 특성인 BASE에 대한 설명이다. 괄호 ( ) 안에 들어갈 특성을 쓰시오.

( 1 ) - 언제든지 데이터는 접근 할 수 있어야 하는 속성

Soft-State - 노드의 상태는 내부에 포함된 정보에 의해 결정되는 것이 아니라 외부에서 ㅈ던송된 정보를 통해 결정되는 속성

( 2 ) - 일정 시간이 지나면 데이터의 일관성이 유지되는 속성

1: Basically Available

2: Eventually Con-sistence

BASE = Basically Available , Soft state, Eventually Consistence 의 약자 , 가용성과 성능을 중시하는 분산 시스템의 NoSQL 특성이다.

13. 다음 내용이 설명하는 NoSQL의 유형에 대해서 쓰시오.

from http://arakene.tistory.com/71 by ccl(A) rewrite - 2021-10-10 18:27:08