전체 글47 데이터마이닝 소프트웨어 1. 데이터마이닝 소프트웨어 필요성 데이터마이닝은 데이터를 설명하거나 예측을 용이하게 하기 위하여 데이터로부터 패턴과 관계를 발견하는 다양한 분석 도구를 사용한다. 다양하고 심도 있게 분석할 문제들이 증가함에 따라 훨씬 더 경력한 분석도구에 대한 필요성이 제기되고 있다. 일반 회사나 조직에서는 수천만 그 이상의 데이터와 수백 또는 그 이상의 변수들을 다루기 위해 확장성이 있는 데이터마이닝 소프트웨어를 필요로 한다. 또한 사용자 편의성을 잘 살린 인터페이스(Graphical User Interface)를 이용할 경우 예측 모델의 개발 및 관리, 적용하는 것이 훨씬 쉬어질 수 있다. 2. 데이터마이닝 소프트웨어 조건 데이터마이닝은 단순히 특정 기법이나 알고리즘이 아니라 완전한 하나의 프로세스이다. 산업용 데.. 2023. 4. 5. 데이터마이닝 예비 단계 1. 데이터 집합의 구성 데이터 집합은 일반적으로 변수를 열(Column) 기준으로, 레코드를 행(Row) 기준으로 표기한다. 지도 학습(Supervised Learning)의 경우 이 변수들 중 하나는 출력변수(Ground Truth)가 되며, 일반적으로 열 기준으로 맨 처음 또는 마지막 열에 위치한다. 2. 데이터베이스로부터 표본추출하기 대개의 경우 데이터마이닝 작업을 수행할 때 이용가능한 모든 레코드를 사용하지 않는다. 표본(Sampling) 추출을 통하여 작은 크기의 레코드를 데이터마이닝 작업에 사용하게 된다. 레코드와 변수의 크기(개수 등), 데이터마이닝 소프트웨어, 계산 능력과 용량에 따라 처리 가능한 데이터의 한계 범위는 선택된 데이터마이닝 알고리즘에 따라 달라진다. 한계범위에 속한다 할지라.. 2023. 4. 4. 데이터마이닝 실행 과정 데이터 분석 과정에서 가장 중대한 오류 중의 하나는 문제에 대한 잘못된 이해에서 기인되는 경우가 가장 많다. 따라서 데이터마이닝 알고리즘을 적용하기에 앞서 문제에 대한 충분한 이해가 먼저 수행되어야 한다. 일반적인 데이터마이닝의 실행 과정은 다음과 같다. 1. 데이터마이닝 프로젝트의 목적을 확실히 확인한다. (답을 찾기 위해 수행하는 일회성 프로젝트의 경우) 또는 데이터마이닝 프로젝트의 적용가능성을 확인한다. (연속되는 프로젝트인 경우) 2. 데이터마이닝 분석에서 사용될 데이터를 획득한다. 이 단계에서는 데이터마이닝 분석에 사용될 데이터를 파악하기 위해 방대한 데이터베이스에서 무작위로 표본(Sample)을 추출하는 것을 말한다. 또한 서로 다른 데이터베이스에서 추출된 데이터를 합치는 것을 의미하기도 한다.. 2023. 4. 3. 데이터마이닝 프로세스 - 개념, 지도학습/비지도학습 1. 데이터마이닝 주요 개념 1.1. 분류 분류(Classification) 은 데이터 분석의 가장 기본적인 형태이다. 다양한 동물들의 이미지를 대상으로 개가 이미지 포함되어 있으면 개(Dog) 이미지로 분류되고, 건물이 포함되어 있으면 건물(Building) 이미지로 분류된다. (특이하게 개(Dog)와 건물(Building)이 하나의 이미지에 함께 들어 있는 이미지는 별도의 분류 기준을 적용하기도 한다.) 데이터마이닝의 일반적인 목적은 분류결과가 알려져 있지 않거나 미래에 발생할 경우에 어떠한 분류 결과로 나타날지 또는 나타날 것인지를 예측할 목적으로 데이터를 분석하는 것이다. 즉 분류결과가 알려진 유사 데이터(Training 데이터)를 사용하여 규칙(Modeling, Rule)을 찾아낸 다음, 그 규.. 2023. 4. 2. 데이터마이닝 개요 1. 데이터마이닝이란 무엇인가? "대량의 데이터 집합으로부터 유용한 정보(Information)를 추출하는 것" (Hand et al., 2001) "수많은 데이터 속에서 의미있는 패턴과 규칙을 발견하기 위해서 자동화되거나 반-자동화된 도구를 사용하여 탐색하고 분석하는 과정" (Berry and Linoff, 1997) 가트너 그룹 사이트에서는 다음과 같이 정의하였다. "데이터마이닝은 통계 및 수학적 기술뿐만 아니라 패턴인식 기술들을 이용하여 데이터 저장소에 저장된 대용량의 데이터를 조사함으로써의 의미 있는 새로운 상관관계, 패턴, 추세 등을 발견하는 과정이다." 2. 데이터마이닝의 사용 데이터마이닝은 다양한 분야에서 사용되고 있다. 국방/항공 분야 : 미사일 또는 발사체의 정확도에 영향을 주는 다양한 .. 2023. 4. 1. 이전 1 ··· 5 6 7 8 다음