1. 데이터 소스구조화된 데이터: 관계형 데이터베이스, 데이터 웨어하우스, 기업 애플리케이션(예: CRM, ERP).반구조화된 데이터: XML 파일, JSON 문서, 로그 파일.비구조화된 데이터: 소셜 미디어 게시물, 멀티미디어 파일(이미지, 비디오), 센서 데이터, 이메일.2. 데이터 수집 계층배치 처리: Apache Sqoop, Talend와 같은 도구를 사용하여 다양한 소스로부터 대량의 데이터를 일정 간격으로 가져옵니다.실시간 처리: Apache Kafka, Apache Flume, Amazon Kinesis와 같은 도구를 사용하여 데이터를 실시간으로 스트리밍합니다.변경 데이터 캡처(CDC): Debezium, GoldenGate와 같은 도구를 사용하여 소스 데이터 시스템의 변경 사항을 캡처합니다...