srdb/schema.go

package srdb

import (
	"crypto/sha256"
	"encoding/hex"
	"fmt"
	"reflect"
	"sort"
	"strings"
	"time"
)

// FieldType 字段类型
type FieldType int

const (
	FieldTypeInt64  FieldType = 1
	FieldTypeString FieldType = 2
	FieldTypeFloat  FieldType = 3
	FieldTypeBool   FieldType = 4
)

func (t FieldType) String() string {
	switch t {
	case FieldTypeInt64:
		return "int64"
	case FieldTypeString:
		return "string"
	case FieldTypeFloat:
		return "float64"
	case FieldTypeBool:
		return "bool"
	default:
		return "unknown"
	}
}

// Field 字段定义
type Field struct {
	Name    string    // 字段名
	Type    FieldType // 字段类型
	Indexed bool      // 是否建立索引
	Comment string    // 注释
}

// Schema 表结构定义
type Schema struct {
	Name   string  // Schema 名称
	Fields []Field // 字段列表
}

// NewSchema 创建 Schema
func NewSchema(name string, fields []Field) *Schema {
	return &Schema{
		Name:   name,
		Fields: fields,
	}
}

// StructToFields 从 Go 结构体生成 Field 列表
//
// 支持的 struct tag 格式：
//   - `srdb:"name"` - 指定字段名（默认使用 snake_case 转换）
//   - `srdb:"name;indexed"` - 指定字段名并标记为索引
//   - `srdb:"name;indexed;comment:用户名"` - 完整格式（字段名;索引标记;注释）
//   - `srdb:"-"` - 忽略该字段
//
// Tag 格式说明：
//   - 使用分号 `;` 分隔不同的部分
//   - 第一部分是字段名（可选，默认使用 snake_case 转换结构体字段名）
//   - `indexed` 标记该字段需要索引
//   - `comment:注释内容` 指定字段注释
//
// 默认字段名转换示例：
//   - UserName -> user_name
//   - EmailAddress -> email_address
//   - IsActive -> is_active
//
// 类型映射：
//   - int, int64, int32, int16, int8, uint, uint64, uint32, uint16, uint8 -> FieldTypeInt64
//   - string -> FieldTypeString
//   - float64, float32 -> FieldTypeFloat
//   - bool -> FieldTypeBool
//
// 示例：
//   type User struct {
//       Name  string `srdb:"name;indexed;comment:用户名"`
//       Age   int64  `srdb:"age;comment:年龄"`
//       Email string `srdb:"email;indexed;comment:邮箱"`
//   }
//   fields, err := StructToFields(User{})
//
// 参数：
//   - v: 结构体实例或指针
//
// 返回：
//   - []Field: 字段列表
//   - error: 错误信息
func StructToFields(v any) ([]Field, error) {
	// 获取类型
	typ := reflect.TypeOf(v)
	if typ == nil {
		return nil, fmt.Errorf("invalid type: nil")
	}

	// 如果是指针，获取其指向的类型
	if typ.Kind() == reflect.Ptr {
		typ = typ.Elem()
	}

	// 必须是结构体
	if typ.Kind() != reflect.Struct {
		return nil, fmt.Errorf("expected struct, got %s", typ.Kind())
	}

	var fields []Field

	// 遍历结构体字段
	for i := 0; i < typ.NumField(); i++ {
		field := typ.Field(i)

		// 跳过未导出的字段
		if !field.IsExported() {
			continue
		}

		// 解析 srdb tag
		tag := field.Tag.Get("srdb")
		if tag == "-" {
			// 忽略该字段
			continue
		}

		// 解析字段名、索引标记和注释
		fieldName := camelToSnake(field.Name) // 默认使用 snake_case 字段名
		indexed := false
		comment := ""

		if tag != "" {
			// 使用分号分隔各部分
			parts := strings.Split(tag, ";")

			for idx, part := range parts {
				part = strings.TrimSpace(part)

				if idx == 0 && part != "" {
					// 第一部分是字段名
					fieldName = part
				} else if part == "indexed" {
					// indexed 标记
					indexed = true
				} else if strings.HasPrefix(part, "comment:") {
					// comment:注释内容
					comment = strings.TrimPrefix(part, "comment:")
				}
			}
		}

		// 映射 Go 类型到 FieldType
		fieldType, err := goTypeToFieldType(field.Type)
		if err != nil {
			return nil, fmt.Errorf("field %s: %w", field.Name, err)
		}

		fields = append(fields, Field{
			Name:    fieldName,
			Type:    fieldType,
			Indexed: indexed,
			Comment: comment,
		})
	}

	if len(fields) == 0 {
		return nil, fmt.Errorf("no exported fields found in struct")
	}

	return fields, nil
}

// goTypeToFieldType 将 Go 类型映射到 FieldType
func goTypeToFieldType(typ reflect.Type) (FieldType, error) {
	switch typ.Kind() {
	case reflect.Int, reflect.Int64, reflect.Int32, reflect.Int16, reflect.Int8,
		reflect.Uint, reflect.Uint64, reflect.Uint32, reflect.Uint16, reflect.Uint8:
		return FieldTypeInt64, nil
	case reflect.String:
		return FieldTypeString, nil
	case reflect.Float64, reflect.Float32:
		return FieldTypeFloat, nil
	case reflect.Bool:
		return FieldTypeBool, nil
	default:
		return 0, fmt.Errorf("unsupported type: %s", typ.Kind())
	}
}

// camelToSnake 将驼峰命名转换为 snake_case
//
// 示例：
//   - UserName -> user_name
//   - EmailAddress -> email_address
//   - IsActive -> is_active
//   - HTTPServer -> http_server
//   - ID -> id
func camelToSnake(s string) string {
	var result strings.Builder
	result.Grow(len(s) + 5) // 预分配空间

	for i, r := range s {
		// 如果是大写字母
		if r >= 'A' && r <= 'Z' {
			// 不是第一个字符，并且前一个字符不是大写，需要添加下划线
			if i > 0 {
				// 检查是否需要添加下划线
				// 规则：
				// 1. 前一个字符是小写字母 -> 添加下划线
				// 2. 当前是大写，后一个是小写（处理 HTTPServer -> http_server）-> 添加下划线
				prevChar := rune(s[i-1])
				needUnderscore := false

				if prevChar >= 'a' && prevChar <= 'z' {
					// 前一个是小写字母
					needUnderscore = true
				} else if prevChar >= 'A' && prevChar <= 'Z' {
					// 前一个是大写字母，检查后一个
					if i+1 < len(s) {
						nextChar := rune(s[i+1])
						if nextChar >= 'a' && nextChar <= 'z' {
							// 后一个是小写字母，说明是新单词开始
							needUnderscore = true
						}
					}
				} else {
					// 前一个是数字或其他字符
					needUnderscore = true
				}

				if needUnderscore {
					result.WriteRune('_')
				}
			}
			// 转换为小写
			result.WriteRune(r + 32) // 'A' -> 'a' 的 ASCII 差值是 32
		} else {
			result.WriteRune(r)
		}
	}

	return result.String()
}

// GetField 获取字段定义
func (s *Schema) GetField(name string) (*Field, error) {
	for i := range s.Fields {
		if s.Fields[i].Name == name {
			return &s.Fields[i], nil
		}
	}
	return nil, NewErrorf(ErrCodeFieldNotFound, "field %s not found", name)
}

// GetIndexedFields 获取所有需要索引的字段
func (s *Schema) GetIndexedFields() []Field {
	var fields []Field
	for _, field := range s.Fields {
		if field.Indexed {
			fields = append(fields, field)
		}
	}
	return fields
}

// Validate 验证数据是否符合 Schema
func (s *Schema) Validate(data map[string]any) error {
	for _, field := range s.Fields {
		value, exists := data[field.Name]
		if !exists {
			// 字段不存在，允许（可选字段）
			continue
		}

		// 验证类型
		if err := s.validateType(field.Type, value); err != nil {
			return fmt.Errorf("field %s: %v", field.Name, err)
		}
	}
	return nil
}

// ValidateType 验证值的类型（导出方法）
func (s *Schema) ValidateType(typ FieldType, value any) error {
	return s.validateType(typ, value)
}

// validateType 验证值的类型
func (s *Schema) validateType(typ FieldType, value any) error {
	switch typ {
	case FieldTypeInt64:
		switch value.(type) {
		case int, int64, int32, int16, int8:
			return nil
		case float64:
			// JSON 解析后数字都是 float64
			return nil
		default:
			return fmt.Errorf("expected int64, got %T", value)
		}
	case FieldTypeString:
		if _, ok := value.(string); !ok {
			return fmt.Errorf("expected string, got %T", value)
		}
	case FieldTypeFloat:
		switch value.(type) {
		case float64, float32:
			return nil
		default:
			return fmt.Errorf("expected float, got %T", value)
		}
	case FieldTypeBool:
		if _, ok := value.(bool); !ok {
			return fmt.Errorf("expected bool, got %T", value)
		}
	}
	return nil
}

// ExtractIndexValue 提取索引值
func (s *Schema) ExtractIndexValue(field string, data map[string]any) (any, error) {
	fieldDef, err := s.GetField(field)
	if err != nil {
		return nil, err
	}

	value, exists := data[field]
	if !exists {
		return nil, NewErrorf(ErrCodeFieldNotFound, "field %s not found in data", field)
	}

	// 类型转换
	switch fieldDef.Type {
	case FieldTypeInt64:
		switch v := value.(type) {
		case int:
			return int64(v), nil
		case int64:
			return v, nil
		case float64:
			return int64(v), nil
		default:
			return nil, fmt.Errorf("cannot convert %T to int64", value)
		}
	case FieldTypeString:
		if v, ok := value.(string); ok {
			return v, nil
		}
		return nil, fmt.Errorf("cannot convert %T to string", value)
	case FieldTypeFloat:
		if v, ok := value.(float64); ok {
			return v, nil
		}
		return nil, fmt.Errorf("cannot convert %T to float64", value)
	case FieldTypeBool:
		if v, ok := value.(bool); ok {
			return v, nil
		}
		return nil, fmt.Errorf("cannot convert %T to bool", value)
	}

	return nil, fmt.Errorf("unsupported type: %v", fieldDef.Type)
}

// ComputeChecksum 计算 Schema 的 SHA256 校验和
// 使用确定性的字符串拼接算法，不依赖 json.Marshal
// 这样即使 Schema struct 添加新字段，只要核心内容（Name、Fields）不变，checksum 就不会变
// 重要：字段顺序不影响 checksum，会先按字段名排序
// 格式: "name:<name>;fields:<field1_name>:<field1_type>:<field1_indexed>:<field1_comment>,<field2>..."
func (s *Schema) ComputeChecksum() (string, error) {
	var builder strings.Builder

	// 1. Schema 名称
	builder.WriteString("name:")
	builder.WriteString(s.Name)
	builder.WriteString(";")

	// 2. 复制字段列表并按字段名排序（保证顺序无关性）
	sortedFields := make([]Field, len(s.Fields))
	copy(sortedFields, s.Fields)
	sort.Slice(sortedFields, func(i, j int) bool {
		return sortedFields[i].Name < sortedFields[j].Name
	})

	// 3. 拼接排序后的字段列表
	builder.WriteString("fields:")
	for i, field := range sortedFields {
		if i > 0 {
			builder.WriteString(",")
		}
		// 字段格式: name:type:indexed:comment
		builder.WriteString(field.Name)
		builder.WriteString(":")
		builder.WriteString(field.Type.String())
		builder.WriteString(":")
		if field.Indexed {
			builder.WriteString("1")
		} else {
			builder.WriteString("0")
		}
		builder.WriteString(":")
		builder.WriteString(field.Comment)
	}

	// 计算 SHA256
	hash := sha256.Sum256([]byte(builder.String()))
	return hex.EncodeToString(hash[:]), nil
}

// SchemaFile Schema 文件格式（带校验）
type SchemaFile struct {
	Version   int     `json:"version"`   // 文件格式版本
	Timestamp int64   `json:"timestamp"` // 保存时间戳
	Checksum  string  `json:"checksum"`  // Schema 内容的 SHA256 校验和
	Schema    *Schema `json:"schema"`    // Schema 内容
}

// NewSchemaFile 创建带校验和的 Schema 文件
func NewSchemaFile(schema *Schema) (*SchemaFile, error) {
	checksum, err := schema.ComputeChecksum()
	if err != nil {
		return nil, fmt.Errorf("compute checksum: %w", err)
	}

	return &SchemaFile{
		Version:   1, // 当前文件格式版本
		Timestamp: time.Now().Unix(),
		Checksum:  checksum,
		Schema:    schema,
	}, nil
}

// Verify 验证 Schema 文件的完整性
func (sf *SchemaFile) Verify() error {
	if sf.Schema == nil {
		return fmt.Errorf("schema is nil")
	}

	// 重新计算 checksum
	actualChecksum, err := sf.Schema.ComputeChecksum()
	if err != nil {
		return fmt.Errorf("compute checksum: %w", err)
	}

	// 对比 checksum
	if actualChecksum != sf.Checksum {
		return fmt.Errorf("schema checksum mismatch: expected %s, got %s (schema may have been tampered with)", sf.Checksum, actualChecksum)
	}

	return nil
}
-												Initial commit: SRDB - High-performance LSM-Tree database

- Core engine with MemTable, SST, WAL
- B+Tree indexing for SST files  
- Leveled compaction strategy
- Multi-table database management
- Schema validation and secondary indexes
- Query builder with complex conditions
- Web UI with HTMX for data visualization
- Command-line tools for diagnostics

											
										
										
											2025-10-08 06:38:12 +08:00
+								package srdb
 								import (
 									"crypto/sha256"
 									"encoding/hex"
 									"fmt"
-												前端：优化 Manifest 视图文件显示

- 文件名区域改为左右布局
- 左侧显示文件名（如 000001.sst）
- 右侧显示级别标签（如 L0、L1）
- 添加级别标签样式，使用主题色背景

											
										
										
											2025-10-09 20:03:53 +08:00
+									"reflect"
-												Initial commit: SRDB - High-performance LSM-Tree database

- Core engine with MemTable, SST, WAL
- B+Tree indexing for SST files  
- Leveled compaction strategy
- Multi-table database management
- Schema validation and secondary indexes
- Query builder with complex conditions
- Web UI with HTMX for data visualization
- Command-line tools for diagnostics

											
										
										
											2025-10-08 06:38:12 +08:00
+									"sort"
 									"strings"
 									"time"
 								)
 								// FieldType 字段类型
 								type FieldType int
 								const (
 									FieldTypeInt64  FieldType = 1
 									FieldTypeString FieldType = 2
 									FieldTypeFloat  FieldType = 3
 									FieldTypeBool   FieldType = 4
 								)
 								func (t FieldType) String() string {
 									switch t {
 									case FieldTypeInt64:
 										return "int64"
 									case FieldTypeString:
 										return "string"
 									case FieldTypeFloat:
 										return "float64"
 									case FieldTypeBool:
 										return "bool"
 									default:
 										return "unknown"
 									}
 								}
 								// Field 字段定义
 								type Field struct {
 									Name    string    // 字段名
 									Type    FieldType // 字段类型
 									Indexed bool      // 是否建立索引
 									Comment string    // 注释
 								}
 								// Schema 表结构定义
 								type Schema struct {
 									Name   string  // Schema 名称
 									Fields []Field // 字段列表
 								}
-												前端：优化 Manifest 视图文件显示

- 文件名区域改为左右布局
- 左侧显示文件名（如 000001.sst）
- 右侧显示级别标签（如 L0、L1）
- 添加级别标签样式，使用主题色背景

											
										
										
											2025-10-09 20:03:53 +08:00
+								// NewSchema 创建 Schema
-												Initial commit: SRDB - High-performance LSM-Tree database

- Core engine with MemTable, SST, WAL
- B+Tree indexing for SST files  
- Leveled compaction strategy
- Multi-table database management
- Schema validation and secondary indexes
- Query builder with complex conditions
- Web UI with HTMX for data visualization
- Command-line tools for diagnostics

											
										
										
											2025-10-08 06:38:12 +08:00
+								func NewSchema(name string, fields []Field) *Schema {
 									return &Schema{
 										Name:   name,
 										Fields: fields,
 									}
 								}
-												前端：优化 Manifest 视图文件显示

- 文件名区域改为左右布局
- 左侧显示文件名（如 000001.sst）
- 右侧显示级别标签（如 L0、L1）
- 添加级别标签样式，使用主题色背景

											
										
										
											2025-10-09 20:03:53 +08:00
+								// StructToFields 从 Go 结构体生成 Field 列表
 								//
 								// 支持的 struct tag 格式：
 								//   - `srdb:"name"` - 指定字段名（默认使用 snake_case 转换）
 								//   - `srdb:"name;indexed"` - 指定字段名并标记为索引
 								//   - `srdb:"name;indexed;comment:用户名"` - 完整格式（字段名;索引标记;注释）
 								//   - `srdb:"-"` - 忽略该字段
 								//
 								// Tag 格式说明：
 								//   - 使用分号 `;` 分隔不同的部分
 								//   - 第一部分是字段名（可选，默认使用 snake_case 转换结构体字段名）
 								//   - `indexed` 标记该字段需要索引
 								//   - `comment:注释内容` 指定字段注释
 								//
 								// 默认字段名转换示例：
 								//   - UserName -> user_name
 								//   - EmailAddress -> email_address
 								//   - IsActive -> is_active
 								//
 								// 类型映射：
 								//   - int, int64, int32, int16, int8, uint, uint64, uint32, uint16, uint8 -> FieldTypeInt64
 								//   - string -> FieldTypeString
 								//   - float64, float32 -> FieldTypeFloat
 								//   - bool -> FieldTypeBool
 								//
 								// 示例：
 								//   type User struct {
 								//       Name  string `srdb:"name;indexed;comment:用户名"`
 								//       Age   int64  `srdb:"age;comment:年龄"`
 								//       Email string `srdb:"email;indexed;comment:邮箱"`
 								//   }
 								//   fields, err := StructToFields(User{})
 								//
 								// 参数：
 								//   - v: 结构体实例或指针
 								//
 								// 返回：
 								//   - []Field: 字段列表
 								//   - error: 错误信息
 								func StructToFields(v any) ([]Field, error) {
 									// 获取类型
 									typ := reflect.TypeOf(v)
 									if typ == nil {
 										return nil, fmt.Errorf("invalid type: nil")
 									}
 									// 如果是指针，获取其指向的类型
 									if typ.Kind() == reflect.Ptr {
 										typ = typ.Elem()
 									}
 									// 必须是结构体
 									if typ.Kind() != reflect.Struct {
 										return nil, fmt.Errorf("expected struct, got %s", typ.Kind())
 									}
 									var fields []Field
 									// 遍历结构体字段
 									for i := 0; i < typ.NumField(); i++ {
 										field := typ.Field(i)
 										// 跳过未导出的字段
 										if !field.IsExported() {
 											continue
 										}
 										// 解析 srdb tag
 										tag := field.Tag.Get("srdb")
 										if tag == "-" {
 											// 忽略该字段
 											continue
 										}
 										// 解析字段名、索引标记和注释
 										fieldName := camelToSnake(field.Name) // 默认使用 snake_case 字段名
 										indexed := false
 										comment := ""
 										if tag != "" {
 											// 使用分号分隔各部分
 											parts := strings.Split(tag, ";")
 											for idx, part := range parts {
 												part = strings.TrimSpace(part)
 												if idx == 0 && part != "" {
 													// 第一部分是字段名
 													fieldName = part
 												} else if part == "indexed" {
 													// indexed 标记
 													indexed = true
 												} else if strings.HasPrefix(part, "comment:") {
 													// comment:注释内容
 													comment = strings.TrimPrefix(part, "comment:")
 												}
 											}
 										}
 										// 映射 Go 类型到 FieldType
 										fieldType, err := goTypeToFieldType(field.Type)
 										if err != nil {
 											return nil, fmt.Errorf("field %s: %w", field.Name, err)
 										}
 										fields = append(fields, Field{
 											Name:    fieldName,
 											Type:    fieldType,
 											Indexed: indexed,
 											Comment: comment,
 										})
 									}
 									if len(fields) == 0 {
 										return nil, fmt.Errorf("no exported fields found in struct")
 									}
 									return fields, nil
 								}
 								// goTypeToFieldType 将 Go 类型映射到 FieldType
 								func goTypeToFieldType(typ reflect.Type) (FieldType, error) {
 									switch typ.Kind() {
 									case reflect.Int, reflect.Int64, reflect.Int32, reflect.Int16, reflect.Int8,
 										reflect.Uint, reflect.Uint64, reflect.Uint32, reflect.Uint16, reflect.Uint8:
 										return FieldTypeInt64, nil
 									case reflect.String:
 										return FieldTypeString, nil
 									case reflect.Float64, reflect.Float32:
 										return FieldTypeFloat, nil
 									case reflect.Bool:
 										return FieldTypeBool, nil
 									default:
 										return 0, fmt.Errorf("unsupported type: %s", typ.Kind())
 									}
 								}
 								// camelToSnake 将驼峰命名转换为 snake_case
 								//
 								// 示例：
 								//   - UserName -> user_name
 								//   - EmailAddress -> email_address
 								//   - IsActive -> is_active
 								//   - HTTPServer -> http_server
 								//   - ID -> id
 								func camelToSnake(s string) string {
 									var result strings.Builder
 									result.Grow(len(s) + 5) // 预分配空间
 									for i, r := range s {
 										// 如果是大写字母
 										if r >= 'A' && r <= 'Z' {
 											// 不是第一个字符，并且前一个字符不是大写，需要添加下划线
 											if i > 0 {
 												// 检查是否需要添加下划线
 												// 规则：
 												// 1. 前一个字符是小写字母 -> 添加下划线
 												// 2. 当前是大写，后一个是小写（处理 HTTPServer -> http_server）-> 添加下划线
 												prevChar := rune(s[i-1])
 												needUnderscore := false
 												if prevChar >= 'a' && prevChar <= 'z' {
 													// 前一个是小写字母
 													needUnderscore = true
 												} else if prevChar >= 'A' && prevChar <= 'Z' {
 													// 前一个是大写字母，检查后一个
 													if i+1 < len(s) {
 														nextChar := rune(s[i+1])
 														if nextChar >= 'a' && nextChar <= 'z' {
 															// 后一个是小写字母，说明是新单词开始
 															needUnderscore = true
 														}
 													}
 												} else {
 													// 前一个是数字或其他字符
 													needUnderscore = true
 												}
 												if needUnderscore {
 													result.WriteRune('_')
 												}
 											}
 											// 转换为小写
 											result.WriteRune(r + 32) // 'A' -> 'a' 的 ASCII 差值是 32
 										} else {
 											result.WriteRune(r)
 										}
 									}
 									return result.String()
 								}
-												Initial commit: SRDB - High-performance LSM-Tree database

- Core engine with MemTable, SST, WAL
- B+Tree indexing for SST files  
- Leveled compaction strategy
- Multi-table database management
- Schema validation and secondary indexes
- Query builder with complex conditions
- Web UI with HTMX for data visualization
- Command-line tools for diagnostics

											
										
										
											2025-10-08 06:38:12 +08:00
+								// GetField 获取字段定义
 								func (s *Schema) GetField(name string) (*Field, error) {
 									for i := range s.Fields {
 										if s.Fields[i].Name == name {
 											return &s.Fields[i], nil
 										}
 									}
-												文档：更新 DESIGN.md，使用英文注释和调整项目结构说明

											
										
										
											2025-10-09 01:33:22 +08:00
+									return nil, NewErrorf(ErrCodeFieldNotFound, "field %s not found", name)
-												Initial commit: SRDB - High-performance LSM-Tree database

- Core engine with MemTable, SST, WAL
- B+Tree indexing for SST files  
- Leveled compaction strategy
- Multi-table database management
- Schema validation and secondary indexes
- Query builder with complex conditions
- Web UI with HTMX for data visualization
- Command-line tools for diagnostics

											
										
										
											2025-10-08 06:38:12 +08:00
+								}
 								// GetIndexedFields 获取所有需要索引的字段
 								func (s *Schema) GetIndexedFields() []Field {
 									var fields []Field
 									for _, field := range s.Fields {
 										if field.Indexed {
 											fields = append(fields, field)
 										}
 									}
 									return fields
 								}
 								// Validate 验证数据是否符合 Schema
 								func (s *Schema) Validate(data map[string]any) error {
 									for _, field := range s.Fields {
 										value, exists := data[field.Name]
 										if !exists {
 											// 字段不存在，允许（可选字段）
 											continue
 										}
 										// 验证类型
 										if err := s.validateType(field.Type, value); err != nil {
 											return fmt.Errorf("field %s: %v", field.Name, err)
 										}
 									}
 									return nil
 								}
 								// ValidateType 验证值的类型（导出方法）
 								func (s *Schema) ValidateType(typ FieldType, value any) error {
 									return s.validateType(typ, value)
 								}
 								// validateType 验证值的类型
 								func (s *Schema) validateType(typ FieldType, value any) error {
 									switch typ {
 									case FieldTypeInt64:
 										switch value.(type) {
 										case int, int64, int32, int16, int8:
 											return nil
 										case float64:
 											// JSON 解析后数字都是 float64
 											return nil
 										default:
 											return fmt.Errorf("expected int64, got %T", value)
 										}
 									case FieldTypeString:
 										if _, ok := value.(string); !ok {
 											return fmt.Errorf("expected string, got %T", value)
 										}
 									case FieldTypeFloat:
 										switch value.(type) {
 										case float64, float32:
 											return nil
 										default:
 											return fmt.Errorf("expected float, got %T", value)
 										}
 									case FieldTypeBool:
 										if _, ok := value.(bool); !ok {
 											return fmt.Errorf("expected bool, got %T", value)
 										}
 									}
 									return nil
 								}
 								// ExtractIndexValue 提取索引值
 								func (s *Schema) ExtractIndexValue(field string, data map[string]any) (any, error) {
 									fieldDef, err := s.GetField(field)
 									if err != nil {
 										return nil, err
 									}
 									value, exists := data[field]
 									if !exists {
-												文档：更新 DESIGN.md，使用英文注释和调整项目结构说明

											
										
										
											2025-10-09 01:33:22 +08:00
+										return nil, NewErrorf(ErrCodeFieldNotFound, "field %s not found in data", field)
-												Initial commit: SRDB - High-performance LSM-Tree database

- Core engine with MemTable, SST, WAL
- B+Tree indexing for SST files  
- Leveled compaction strategy
- Multi-table database management
- Schema validation and secondary indexes
- Query builder with complex conditions
- Web UI with HTMX for data visualization
- Command-line tools for diagnostics

											
										
										
											2025-10-08 06:38:12 +08:00
+									}
 									// 类型转换
 									switch fieldDef.Type {
 									case FieldTypeInt64:
 										switch v := value.(type) {
 										case int:
 											return int64(v), nil
 										case int64:
 											return v, nil
 										case float64:
 											return int64(v), nil
 										default:
 											return nil, fmt.Errorf("cannot convert %T to int64", value)
 										}
 									case FieldTypeString:
 										if v, ok := value.(string); ok {
 											return v, nil
 										}
 										return nil, fmt.Errorf("cannot convert %T to string", value)
 									case FieldTypeFloat:
 										if v, ok := value.(float64); ok {
 											return v, nil
 										}
 										return nil, fmt.Errorf("cannot convert %T to float64", value)
 									case FieldTypeBool:
 										if v, ok := value.(bool); ok {
 											return v, nil
 										}
 										return nil, fmt.Errorf("cannot convert %T to bool", value)
 									}
 									return nil, fmt.Errorf("unsupported type: %v", fieldDef.Type)
 								}
 								// ComputeChecksum 计算 Schema 的 SHA256 校验和
 								// 使用确定性的字符串拼接算法，不依赖 json.Marshal
 								// 这样即使 Schema struct 添加新字段，只要核心内容（Name、Fields）不变，checksum 就不会变
 								// 重要：字段顺序不影响 checksum，会先按字段名排序
 								// 格式: "name:<name>;fields:<field1_name>:<field1_type>:<field1_indexed>:<field1_comment>,<field2>..."
 								func (s *Schema) ComputeChecksum() (string, error) {
 									var builder strings.Builder
 									// 1. Schema 名称
 									builder.WriteString("name:")
 									builder.WriteString(s.Name)
 									builder.WriteString(";")
 									// 2. 复制字段列表并按字段名排序（保证顺序无关性）
 									sortedFields := make([]Field, len(s.Fields))
 									copy(sortedFields, s.Fields)
 									sort.Slice(sortedFields, func(i, j int) bool {
 										return sortedFields[i].Name < sortedFields[j].Name
 									})
 									// 3. 拼接排序后的字段列表
 									builder.WriteString("fields:")
 									for i, field := range sortedFields {
 										if i > 0 {
 											builder.WriteString(",")
 										}
 										// 字段格式: name:type:indexed:comment
 										builder.WriteString(field.Name)
 										builder.WriteString(":")
 										builder.WriteString(field.Type.String())
 										builder.WriteString(":")
 										if field.Indexed {
 											builder.WriteString("1")
 										} else {
 											builder.WriteString("0")
 										}
 										builder.WriteString(":")
 										builder.WriteString(field.Comment)
 									}
 									// 计算 SHA256
 									hash := sha256.Sum256([]byte(builder.String()))
 									return hex.EncodeToString(hash[:]), nil
 								}
 								// SchemaFile Schema 文件格式（带校验）
 								type SchemaFile struct {
 									Version   int     `json:"version"`   // 文件格式版本
 									Timestamp int64   `json:"timestamp"` // 保存时间戳
 									Checksum  string  `json:"checksum"`  // Schema 内容的 SHA256 校验和
 									Schema    *Schema `json:"schema"`    // Schema 内容
 								}
 								// NewSchemaFile 创建带校验和的 Schema 文件
 								func NewSchemaFile(schema *Schema) (*SchemaFile, error) {
 									checksum, err := schema.ComputeChecksum()
 									if err != nil {
 										return nil, fmt.Errorf("compute checksum: %w", err)
 									}
 									return &SchemaFile{
 										Version:   1, // 当前文件格式版本
 										Timestamp: time.Now().Unix(),
 										Checksum:  checksum,
 										Schema:    schema,
 									}, nil
 								}
 								// Verify 验证 Schema 文件的完整性
 								func (sf *SchemaFile) Verify() error {
 									if sf.Schema == nil {
 										return fmt.Errorf("schema is nil")
 									}
 									// 重新计算 checksum
 									actualChecksum, err := sf.Schema.ComputeChecksum()
 									if err != nil {
 										return fmt.Errorf("compute checksum: %w", err)
 									}
 									// 对比 checksum
 									if actualChecksum != sf.Checksum {
 										return fmt.Errorf("schema checksum mismatch: expected %s, got %s (schema may have been tampered with)", sf.Checksum, actualChecksum)
 									}
 									return nil
 								}