일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- airflow
- zookeeper
- helm
- JavaScript
- ip
- Vision
- EC2
- Packet
- OS
- AWS
- grafana
- CSV
- MAC address
- tcp
- docker
- Operating System
- Spring
- kubernetes
- log
- jvm
- kubeadm
- Python
- PostgreSQL
- CVAT
- aws s3
- Network
- Trino
- kubectl
- Kafka
- java
Archives
- Today
- Total
목록redshift (1)
JUST WRITE
따릉이 대여소 정보 Dashboard 구성(5) - Parquet 형식으로 Data 변환
AWS Cloud 실습을 위해 진행한 개인 프로젝트를 정리한 글입니다. 서울 따릉이 대여소 Data를 AWS Service와 Grafana를 이용하여 Dashboard까지 구성해보았다. 따릉이 대여소 Data를 정재한 다음 CSV로 만들었다. Parquet 형식으로 하면 성능면에서 개선이 될 수 있을 거 같아 시도해보았다. Parquet 형식으로 Data 정제 따릉이 대여소 정보와 실시간 대여 정보를 Python Code로 정제하여 CSV 파일로 만들었다. Python fastparquet package를 활용하여 CSV가 아닌 Parquet으로 결과물을 만들었다. # (기존) CSV 파일 생성 impart pandas as pd file_name = 'seoul_rentbike_info_{}.csv'...
Cloud
2022. 3. 2. 12:43