728x90

데이터분석 6

FastAPI 강좌 4강: 데이터 분석 결과 API 구현

데이터 분석 결과 API 구현강의 목표:데이터를 실시간으로 분석하고 그 결과를 API를 통해 제공하는 방법을 이해한다./summary와 /top_customers와 같은 분석 결과를 반환하는 엔드포인트를 구현한다. 강의 세부 내용:1. 데이터 분석 결과 API 개요실시간 분석 결과 제공: FastAPI를 통해 실시간으로 데이터 분석 결과를 API로 제공할 수 있습니다. 이를 통해 클라이언트는 항상 최신 데이터를 조회할 수 있습니다.분석 결과 제공 엔드포인트: 데이터 분석 작업을 자동화하고, 필요한 통계 정보를 API 요청에 따라 반환하는 구조를 구현합니다.실습: 데이터 분석 결과를 반환하는 엔드포인트 구현1. 기본 분석 API 엔드포인트 구현먼저 데이터를 간단하게 분석하고 그 결과를 반환하는 /summa..

FastAPI 2024.10.09

FastAPI 강좌 3강: 데이터 처리와 Pandas 연동

데이터 처리와 Pandas 연동강의 목표:FastAPI와 Pandas를 연동하여 데이터를 처리하는 방법을 이해한다.수집된 데이터를 Pandas로 처리하여 변환하는 /process_data 엔드포인트를 구현한다. 강의 세부 내용:1. Pandas와 FastAPI 연동 개념Pandas: Python의 대표적인 데이터 분석 라이브러리로, 데이터 처리 및 변환에 최적화되어 있습니다. 테이블 형태의 데이터를 다루고, 데이터 정리, 변환, 필터링 등 다양한 기능을 제공합니다.FastAPI와 Pandas의 연동: 수집된 데이터를 FastAPI에서 받아 Pandas로 처리하여 통계나 데이터를 변환한 후 클라이언트에 반환하는 구조를 학습합니다.2. Pandas 기본 기능 소개Pandas의 주요 객체:DataFrame: ..

FastAPI 2024.10.09

데이터 분석 개발자를 위한 FastAPI 강좌 (8강)

시나리오: "데이터 분석 결과를 FastAPI로 제공하는 데이터 파이프라인 구축하기"배경:한 스타트업에서 데이터 분석팀은 매일 수집되는 데이터를 바탕으로 간단한 분석을 수행하고 그 결과를 비즈니스 부서에 제공하는 일을 담당하고 있습니다. 하지만 팀이 사용하는 기존 분석 도구는 결과를 매번 수동으로 공유해야 해서 자동화된 시스템을 도입하고 싶어 합니다. 데이터 분석 결과를 실시간으로 요청받아 API 형태로 제공하는 시스템을 구축해야 하며, FastAPI를 이용해 이를 실현하려고 합니다.시나리오 세부 내용:1. 데이터 수집회사에서는 매일 수집되는 고객 트랜잭션 데이터를 분석하고 그 결과를 실시간으로 제공하려고 합니다.FastAPI 서버가 고객 데이터를 받아 API 엔드포인트에서 바로 사용할 수 있도록 설계합..

FastAPI 2024.10.09

빅데이터 플랫폼 시나리오: 소셜 미디어 감정 분석 플랫폼 구축

빅데이터 플랫폼 시나리오: 소셜 미디어 감정 분석 플랫폼 구축1. 프로젝트 개요이번 프로젝트는 소셜 미디어 플랫폼(예: Twitter, Instagram)의 데이터를 수집하여 감정 분석을 수행하는 빅데이터 플랫폼을 구축하는 것을 목표로 합니다. 이를 통해 기업은 고객의 피드백을 실시간으로 모니터링하고, 트렌드를 파악하여 더 나은 비즈니스 결정을 내릴 수 있습니다.2. 데이터 소스소셜 미디어 데이터는 크게 구조화된, 반구조화된, 비구조화된 데이터로 나뉩니다. 이 프로젝트에서 활용할 데이터 유형은 다음과 같습니다:구조화된 데이터: 고객의 CRM 데이터, 마케팅 캠페인 데이터.반구조화된 데이터: 소셜 미디어 API로 수집된 JSON 형식의 댓글 및 사용자 반응 데이터.비구조화된 데이터: 이미지, 비디오, 사용..

BIGDATA PLATFORM 2024.09.10

아토믹데브_실습으로 배우는 빅데이터 플랫폼 아키텍처

1. 데이터 소스구조화된 데이터: 관계형 데이터베이스, 데이터 웨어하우스, 기업 애플리케이션(예: CRM, ERP).반구조화된 데이터: XML 파일, JSON 문서, 로그 파일.비구조화된 데이터: 소셜 미디어 게시물, 멀티미디어 파일(이미지, 비디오), 센서 데이터, 이메일.2. 데이터 수집 계층배치 처리: Apache Sqoop, Talend와 같은 도구를 사용하여 다양한 소스로부터 대량의 데이터를 일정 간격으로 가져옵니다.실시간 처리: Apache Kafka, Apache Flume, Amazon Kinesis와 같은 도구를 사용하여 데이터를 실시간으로 스트리밍합니다.변경 데이터 캡처(CDC): Debezium, GoldenGate와 같은 도구를 사용하여 소스 데이터 시스템의 변경 사항을 캡처합니다...

BIGDATA PLATFORM 2024.08.13

아토믹데브_들어가는 글: 빅데이터 플랫폼의 길잡이가 되기를

빅데이터 플랫폼의 길잡이가 되기를 지난 30여 년간, 저는 글로벌 기업부터 한국의 다양한 기업에 이르기까지 수많은 빅데이터 플랫폼을 개발하고 컨설팅하는 과정을 겪어왔습니다. 이 여정 속에서 저에게 가장 중요한 과제는 단순히 기술적인 문제를 해결하는 것에 그치지 않았습니다. 더 큰 과제는 데이터의 힘을 기업의 성장과 혁신으로 연결시키고, 이를 통해 조직이 변화하는 시장 속에서 한 발 앞서 나갈 수 있도록 돕는 것이었습니다.빅데이터는 이제 단순한 유행어가 아니라, 오늘날 비즈니스 성공의 필수적인 요소가 되었습니다. 하지만 빅데이터 플랫폼을 처음 접하는 개발자들에게는 그 복잡성과 광범위한 기술 스택으로 인해 큰 부담이 될 수 있습니다. 저는 이러한 부담을 조금이라도 덜어주고자, 이 책을 통해 후배 개발자들이 ..

BIGDATA PLATFORM 2024.08.13
728x90