Overview:
Amazon Athena merupakan layanan interaktif analitik tanpa server yang mana perngguna tidak perlu melakukan konfigurasi pada server. Athena dibangun diatas open source. Athena dapat digunakan untuk mengalasis data atau membangun aplikasi dari amazon S3 dan dari sumber data lainnya. Untuk lebih detail mengenai amazon athena, bisa dibaca disini.
Kali ini kita akan melakukan query pada data menggunakan data source dari open street map, untuk menampilkan data berdasarkan lokasi. Adapun langkah-langkah yang akan kita lakukan adalah:
1. Membuat S3 bucket
2. Membuat query athena
3. Menghapus sumber daya
Prasyarat:
- Akun AWS
- S3 bucket
- Athena
Langkah-langkah:
Membuat S3
Buat S3 bucket dengan akses publik
Membuat Athena
1. Buat athena
- Masuk ke service athena
- Klik explore the query editor
- Klik settings
- Manage
- Isi bucket s3
- Isi aws account ID
- Centang assign bucket owner
- Save
2. Buat query untuk membuat database
CREATE DATABASE aha_db;
Jalankan query
Klik tanda plus untuk menambah query baru
3. Buat query untuk membuat tabel baru
CREATE EXTERNAL TABLE planet ( id BIGINT, type STRING, tags MAP<STRING,STRING>, lat DECIMAL(9,7), lon DECIMAL(10,7), nds ARRAY<STRUCT<ref: BIGINT>>, members ARRAY<STRUCT<type: STRING, ref: BIGINT, role: STRING>>, changeset BIGINT, timestamp TIMESTAMP, uid BIGINT, user STRING, version BIGINT ) STORED AS ORCFILE LOCATION 's3://osm-pds/planet/';
Jalankan query
4. Tambah query baru, untuk menampilkan data
Select * from planet LIMIT 100;
Klik run
5. tambah query baru untuk menampilkan data berdasarkan tags, latitude dan longitude
SELECT * from planet WHERE type = 'node' AND tags['amenity'] IN ('veterinary') AND lat BETWEEN -27.8 AND -27.3 AND lon BETWEEN 152.2 AND 153.5;
Hapus sumber daya
1. Hapus table
DROP TABLE planet;
2. Hapus database
DROP DATABASE aha_db;
3. Hapus S3 bucket
Referensi:
0 comments:
Post a Comment