SQL Parser Feature Roadmap

This document outlines missing features compared to comprehensive SQL parsers like DataFusion sqlparser-rs. Current implementation provides ~30% feature coverage with strong support for analytical workloads and comprehensive CRUD operations.

High Priority (Core Functionality)

DDL Enhancements

CREATE INDEX - Index creation with various types (BTREE, HASH, UNIQUE) ✅ COMPLETED
DROP INDEX - Index removal operations ✅ COMPLETED
CREATE DATABASE/SCHEMA - Database and schema management ✅ COMPLETED
CREATE FUNCTION/PROCEDURE - User-defined functions and procedures ✅ COMPLETED
CREATE SEQUENCE - Sequence generators ✅ COMPLETED
ALTER INDEX - Index modifications ✅ COMPLETED

DML Extensions

MERGE statements - UPSERT operations for data synchronization ✅ COMPLETED
Advanced INSERT - More conflict resolution options beyond basic OR clauses ✅ COMPLETED
COPY statements - Bulk data import/export operations ✅ COMPLETED
LOAD DATA - MySQL-style data loading

Essential Utilities

USE database - Database switching (critical for multi-database environments) ✅ COMPLETED
Parameterized queries - Prepared statement placeholders (?, $1, :name, @param) ✅ COMPLETED
PREPARE/EXECUTE - Prepared statement support ✅ COMPLETED
EXPLAIN variants - EXPLAIN ANALYZE, EXPLAIN VERBOSE, etc.
SHOW variants - SHOW FUNCTIONS, SHOW VARIABLES, SHOW STATUS

Medium Priority (Enhanced Functionality)

Advanced Query Features

PIVOT/UNPIVOT - Data reshaping operations
LATERAL joins - Advanced join patterns
TABLESAMPLE - Statistical sampling operations
Table-valued functions - Functions returning table results

Expression Extensions

JSON operations - JSON path expressions, JSON_EXTRACT, etc.
Map/Dictionary operations - Key-value pair handling
Advanced string functions - REGEXP, SIMILAR TO, advanced TRIM
Type operations - CONVERT, AT TIME ZONE, COLLATE
Set operations - ANY/ALL/SOME operators

Additional Statement Types

ATTACH/DETACH DATABASE - Database attachment (SQLite-style)
PRAGMA statements - SQLite configuration directives
FLUSH operations - Cache and buffer management
OPTIMIZE TABLE - Table optimization commands

Dialect Extensions

Microsoft SQL Server (T-SQL) - MSSQL-specific syntax and features
Apache Hive (HQL) - Hadoop Query Language support
Databricks SQL - Spark SQL extensions
ANSI SQL compliance mode - Strict standard adherence

Lower Priority (Specialized Features)

Advanced Analytics

OLAP functions - Advanced ROLLUP, CUBE, GROUPING SETS
Time series functions - Temporal analytics and window functions
Statistical functions - PERCENTILE, STDDEV, advanced aggregates
Machine learning functions - Predictive analytics syntax

Administrative Features

User management - CREATE/ALTER/DROP USER, ROLE management
Security features - Row-level security, column masking
System catalogs - Information schema queries
Backup/restore - Database maintenance operations

Programming Constructs

Control flow - IF/WHILE/CASE statements (not expressions)
Error handling - RAISE, ASSERT, TRY/CATCH blocks
Variable declarations - Local and session variables
Cursors - OPEN, CLOSE, FETCH operations

Data Engineering

Streaming operations - Real-time data processing syntax
Partitioning - Advanced table partitioning schemes
File format support - Parquet, ORC, Avro syntax
External tables - External data source integration

Implementation Notes

Architecture Principles

Maintain modular design with separate files for each feature area
Follow existing patterns for AST definition, parsing, and pretty printing
Ensure comprehensive test coverage for all new features
Support multiple dialects where features overlap

Development Guidelines

Implement high-priority features first to maximize utility
Consider backward compatibility with existing API
Document dialect-specific behaviors clearly
Include error handling and helpful error messages

Testing Strategy

Add both positive and negative test cases
Test dialect-specific variations
Verify pretty printing round-trip accuracy
Include complex real-world query examples

Progress Tracking

Completed Major Features

Window Functions - Complete OVER clause support with partitioning, ordering, and frame specifications
CREATE INDEX - Comprehensive index creation with all standard options
DROP INDEX - Index removal with concurrency and existence checks
CREATE DATABASE/SCHEMA - Database and schema management with character sets
CREATE FUNCTION/PROCEDURE - User-defined functions and procedures with parameters
CREATE SEQUENCE - Sequence generators with all PostgreSQL-style options
ALTER INDEX - Index modification operations with RENAME TO, SET TABLESPACE, RESET, and SET parameter operations
Advanced INSERT - Enhanced conflict resolution with PostgreSQL ON CONFLICT support (DO NOTHING, DO UPDATE SET)
MERGE Statements - Advanced UPSERT operations for data synchronization
USE Database - Database switching for multi-database environments
COPY Statements - Comprehensive bulk data import/export operations with full PostgreSQL syntax support
Parameterized Queries - Prepared statement placeholders supporting multiple formats (?, $1, :name, @param) across all SQL dialects
PREPARE/EXECUTE/DEALLOCATE - Complete prepared statement lifecycle management with support for PostgreSQL, MySQL, and Oracle syntax variations

Current Coverage

~35% feature coverage compared to comprehensive SQL parsers
368 comprehensive tests with high-quality test coverage
5 major SQL language categories fully supported (DML, DDL, TCL, DCL, Utility)
6+ SQL dialects with dialect-specific extensions
Full prepared statement support - Complete lifecycle (PREPARE/EXECUTE/DEALLOCATE) with multi-dialect placeholder support

Next Up

EXPLAIN variants - EXPLAIN ANALYZE, EXPLAIN VERBOSE for query analysis
LOAD DATA - MySQL-style data loading operations
SHOW variants - SHOW FUNCTIONS, SHOW VARIABLES, SHOW STATUS

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

SQL Parser Feature Roadmap

High Priority (Core Functionality)

DDL Enhancements

DML Extensions

Essential Utilities

Medium Priority (Enhanced Functionality)

Advanced Query Features

Expression Extensions

Additional Statement Types

Dialect Extensions

Lower Priority (Specialized Features)

Advanced Analytics

Administrative Features

Programming Constructs

Data Engineering

Implementation Notes

Architecture Principles

Development Guidelines

Testing Strategy

Progress Tracking

Completed Major Features

Current Coverage

Next Up

FilesExpand file tree

ROADMAP.md

Latest commit

History

ROADMAP.md

File metadata and controls

SQL Parser Feature Roadmap

High Priority (Core Functionality)

DDL Enhancements

DML Extensions

Essential Utilities

Medium Priority (Enhanced Functionality)

Advanced Query Features

Expression Extensions

Additional Statement Types

Dialect Extensions

Lower Priority (Specialized Features)

Advanced Analytics

Administrative Features

Programming Constructs

Data Engineering

Implementation Notes

Architecture Principles

Development Guidelines

Testing Strategy

Progress Tracking

Completed Major Features

Current Coverage

Next Up