email-tracker/external/duckdb/test/sql/copy/parquet/hive_timestamps.test

# name: test/sql/copy/parquet/hive_timestamps.test
# description: Prefer strict hive timestamps to dates
# group: [parquet]

require parquet

# requires notwindows for embedded spaces in the path
require notwindows

statement ok
PRAGMA enable_verification

set seed 0.8675309

statement ok
CREATE TABLE raw_data (
  ts TIMESTAMP_S NOT NULL,
  hits INTEGER NOT NULL
);

statement ok
INSERT INTO raw_data
SELECT *, (random() * 500)::INTEGER
FROM RANGE(TIMESTAMP '2023-11-01', TIMESTAMP '2023-11-06', INTERVAL 1 MINUTE);

statement ok
CREATE TABLE timeseries AS (
  SELECT DATE_TRUNC('hour', ts) AS bucket, SUM(hits)::BIGINT AS total
  FROM raw_data
  GROUP BY bucket
);

query II
SELECT *
FROM timeseries
ORDER BY ALL
LIMIT 5
----
2023-11-01 00:00:00	15127
2023-11-01 01:00:00	16634
2023-11-01 02:00:00	14676
2023-11-01 03:00:00	14493
2023-11-01 04:00:00	13288

statement ok
COPY (
  SELECT * FROM timeseries
) TO '__TEST_DIR__/hive' (
  FORMAT 'PARQUET', COMPRESSION 'SNAPPY', PARTITION_BY (bucket), OVERWRITE_OR_IGNORE
);

query II
SELECT bucket, total
FROM read_parquet('__TEST_DIR__/hive/*/*.parquet')
ORDER BY ALL
LIMIT 5
----
2023-11-01 00:00:00	15127
2023-11-01 01:00:00	16634
2023-11-01 02:00:00	14676
2023-11-01 03:00:00	14493
2023-11-01 04:00:00	13288