Skip to main content

Table 생성

경로: “Database” > “Tables” > “Create Table” Tables 화면에는 현재 클러스터에 생성된 모든 테이블 목록이 표시됩니다.

기본 정보 입력

기본 정보 입력 Table 생성 폼의 첫 번째 섹션에서 기본 정보를 입력합니다 .
필드명 ( 화면 표시 )설명타입필수예시
TABLE NAME테이블의 고유 이름 길이 : 64자 제한 StringTextField필수 (*)my-table
Dense Vector EmbeddingDense Embedding은 텍스트를 고정 길이의 밀집 벡터로 변환합니다. 의미적 유사도 검색의 핵심이며, 문맥과 의미를 포착합니다.Dropdown선택DNA 2.0 *운영자 세팅에 따라 달라집니다.
Sparse EmbeddingSparse Embedding은 키워드 기반의 희소 벡터를 생성합니다. Dense와 결합하여 하이브리드 검색을 가능하게 하며, 정확한 키워드 매칭에 강점이 있습니다.Dropdown선택DNA 2.0 *운영자 세팅에 따라 달라집니다.
기본 정보 입력

Tablel Name

테이블의 식별 이름을 입력합니다 Validation :
  • name : 필수 입력 64자 제한
  • a-z, A-Z, 숫자, 하이픈(-) 허용
  • 하이픈 시작/종료 불가
  • 영문으로만 시작 가능
  • 이름 중복 생성 가능 : 필요시 UUID로 구분이 가능합니다.
  • 테이블 이름은 생성 후 변경할 수 없으므로 신중하게 결정하세요
  • 버전 관리가 필요하면 이름에 버전을 포함하세요 ( 예 : embeddings-v1, embeddings-v2

Dense Vector

Dense Embedding은 텍스트를 고정 길이의 밀집 벡터로 변환합니다. 의미적 유사도 검색의 핵심이며, 문맥과 의미를 포착합니다.

Sparse Vector

Sparse Embedding은 키워드 기반의 희소 벡터를 생성합니다. Dense와 결합하여 하이브리드 검색을 가능하게 하며, 정확한 키워드 매칭에 강점이 있습니다.

INDEX 설정 (인덱스 공간)

INDEX 설정 (인덱스 공간)
필드명 ( 화면 표시 )설명타입필수예시
INDEX SPACE벡터 간 유사도 계산 메트릭 — - l2space : L2 Distance (Euclidean, 절대 거리 ) — - ipspace : Inner Product ( 내적 , 방향 + 크기 )Dropdown필수ipspace
M VALUEHNSW 연결 밀도 — - 높을수록 정확도 증가 , 메모리 사용 증가 — - 권장값 : 16Number (10~1024)범위의 정수필수16
EF CONSTRUCTION인덱스 구축 품질 — - 높을수록 인덱스 품질 향상 , 구축 시간 증가 — - 권장값 : M Value~ Active set sizeNumber (M Value~ Active set size)필수128
ACTIVE SET SIZE메모리에 동시 로드 가능한 벡터 개수 — - 인덱스의 메모리 캐시 크기 — - LRU 방식 관리Number (100~1,000,000)필수50000
Segmentation Buckets해시 세그멘테이션 버킷 수 (기본값: 1)수 — - 데이터를 분산 저장할 버킷 수입니다. 해시 세그멘테이션을 활성화하여 대용량 데이터의 병렬 처리 성능을 향상시킵니다.Number (1~10)필수1

INDEX Space

  • 벡터간 유사도를 계산하는 거리 메트릭을 선택합니다 .
선택 가능한옵션 :
Index Space계산 방식범위특징적합한 데이터
l2spaceL2 Distance (Euclidean)0 ~ ∞ (0 에 가까울수록 유사 )절대 거리 계산 , 벡터 크기에 민감이미지 특징 , 좌표 데이터 , 정규화되지 않은 벡터
ipspaceInner Product ( 내적 )-∞ ~ ∞ ( 클수록 유사 )벡터 크기와 방향 모두 고려텍스트 임베딩 , 추천 시스템 , 정규화된 벡터

M value

  • HNSW 인덱스의 그래프 연결 밀도를 설정합니다 .
  • 의미 :각 노드가 연결할 이웃 노드의 개수
  • 범위 : 1 ~ 1024 범위의 정수
  • 권장값: 16
  • 높을수록 :정확도증가 ,메모리사용 증가 ,검색 속도 약간 감소
  • 낮을수록 :메모리사용 감소 ,정확도감소*

EF CONSTRUCTION (인덱스 구축 품질)

  • 인덱스 구축 시 탐색할 후보 노드 수를 설정합니다 .
  • 의미 : 인덱스 구축 시 탐색할 이웃 노드의개수
  • 범위 : M value 값 이상 ACTIVE SET SIZE 이하의 정수
  • 권장값 : 128
  • 높을수록 : 인덱스 품질 향상 , 구축 시간 증가
  • 낮을수록 : 구축 시간 감소 , 인덱스 품질 저하

ACTIVE SET SIZE (활성 벡터 제한)�

  • 메모리에 동시에 로드할 수 있는 벡터 개수의 최대값입니다 .
  • 의미 : diskbased 인덱스에서 메모리 캐시 크기 결정
  • 범위 : 100 이상 1,000,000 이하의 정수
  • 기본값 : 50000

COLUMNS ( 스키마 정의 )

테이블에 저장할 데이터의 구조를 정의합니다 . 각 컬럼의 이름 , 데이터 타입 , 제약 조건을 설정합니다. COLUMNS ( 스키마 정의 ) 각 컬럼은 다음 필드로 구성됩니다 :
필드명 ( 화면 표시 )설명타입필수예시
COLUMN ID컬럼의 고유 이름 — - 길이 : 1~64 자 — - 허용 문자 : 영문 소문자 , 숫자 , 언더스코어 (_) — - 영문으로 시작 — - 중복 불가’Duplicate column name exists.’ 메세지 발생TextField필수 (*)id, text, embedding
DATA TYPE컬럼 데이터 타입 — - string : 문자열 — - vector : 벡터 ( 부동소수점 배열 ) — - int64 : 64 비트 정수 — - double : 64 비트 부동소수점 — - boolean : 불리언Dropdown필수string, vector
Nullavle데이터 필수 여부 확인 — - Sparse Column, Dense Column 응 기준이 되는 컬럼이면 비활성화Dropdown필수false, true
DIMENSION벡터 차원 수 — - vector 타입일 때만 표시 — - 16의 배수여야함 - 범위 : 1~65536 — - 모델 출력 차원과 정확히 일치해야 함Number (1~65536)vector 타입 시 필수1024, 1536, 768
Sparse Column최대 1 개만 선택 가능 ( 라디오 버튼 동작 ) — - 체크된 컬럼이 Sparse 벡터 검색 대상Checkbox선택(embedding 컬럼 )
Dense Columnvector 타입일 때만 활성화 — - 최대 1 개만 선택 가능 ( 라디오 버튼 동작 ) — - 체크된 컬럼이 벡터 Dense 검색 대상Checkbox선택(embedding 컬럼 )
PRIMARYPrimary Key 컬럼 지정 — - string 타입일 때만 활성화 — - 최대 1 개만 선택 가능 ( 라디오 버튼 동작 ) — - 고유성 보장 , 행 식별용Checkbox권장(id 컬럼 )

기본 칼럼 구조

테이블 생성 시 다음 4 개 컬럼이 자동으로 생성됩니다 :
col_iddata_typedimensionis_primaryANN
idstring0true-
metadatastring0false-
textstring0false-
embeddingvector1024false체크
컬럼 동작
동작설명결과
새 컬럼 추가빈 컬럼 행 생성
Delete컬럼 삭제해당 컬럼 제거 ( 최소 1 개는 남아야 함 )
DATA TYPE 변경데이터 타입 변경 시- vector → 다른 타입 : DIMENSION 자동 0 으로 초기화 , ANN 해제 — - 다른 타입 → vector: DIMENSION 필드 표시
PRIMARY 선택다른 컬럼의 PRIMARY 체크이전 PRIMARY 자동 해제 ( 라디오 버튼 동작 )
ANN 선택다른 컬럼의 ANN 체크이전 ANN 자동 해제 ( 라디오 버튼 동작 )

COLUMN ID* (컬럼 이름)�

컬럼의 고유 식별이름을 입력합니다. 입력 규칙 :
  • 필수 입력 64자 제한
  • a-z, A-Z, 숫자, 하이픈(-) 허용
  • 하이픈 시작/종료 불가
  • 이름 중복 생성 가능 : 필요시 UUID로 구분이 가능합니다.
  • 영문으로만 시작 가능
  • 중복 이름 불가 ’Duplicate column name exists.’ 메세지 발생
기본 세팅 id,metadata,text,embedding

DATA TYPE* (데이터 타입)�

컬럼에 저장될 데이터의 타입을 선택합니다 . 선택 가능한 데이터 타입 :
Data Type설명예시 값저장 크기용도
string문자열” hello ”, “2023-10-17”가변텍스트 , ID, 메타데이터
vector벡터 ( 부동소수점 배열 )고정 ( 차원 × 4 bytes)임베딩 벡터
int6464 비트 정수123, -456, 08 bytes숫자 ID, 카운트
double64 비트 부동소수점3.14, -0.001, 1e-58 bytes실수 , 점수 , 확률
boolean불리언 ( 참 / 거짓 )true, false1 byte플래그 , 상태

DATA TYPE 상세 설명

String (문자열)

특징 :
  • 가변 길이 : 1 글자 ~ 수 MB 까지 저장 가능
  • UTF-8 인코딩 : 한글 , 중국어 , 이모지 등 모든 유니코드 지원
  • 인덱스 불가 : 벡터 검색 인덱스에는 사용할 수 없음 ( 메타데이터로만 사용 )
사용 예시:
{
  "id": "doc_123456",
  "text": "This is an example document about machine learning.",
  "metadata": "{ \"author\": \"John\", \"category\": \"AI\" }",
  "url": "https://example.com/doc/123456"
}
  • JSON 데이터는 문자열로 저장하고 , 애플리케이션에서 파싱하세요
  • 날짜 / 시간은 ISO 8601 형식으로 저장하세요 : “2023-10-17T14:30:00Z”

VECTOR (벡터)�

특징 :
  • 고정 차원 : 생성 시 지정한 차원 수만 저장 가능
  • float32 정밀도 : 각 요소는 32 비트 부동소수점
  • ANN 검색 가능 : 벡터 검색 인덱스 구축 가능
DIMENSION 필드 :
  • vector 타입 선택 시 DIMENSION 입력 필드가 활성화됩니다
  • 벡터 차원 수를 입력해야 합니다 (1~65536)
화면 표시 예시 : Data Type: [vector ▼] Dimension: [1024 ] ← 입력 필수 저장 크기 계산 : 차원 수 = 1024 저장 크기 = 1024 × 4 bytes = 4096 bytes = 4 KB 차원 수 = 3072 저장 크기 = 3072 × 4 bytes = 12,288 bytes ≈ 12 KB
  • DIMENSION 은 테이블 생성 후 변경할 수 없습니다
  • DIMENSION 은 16의 배수로 설정되어야 합니다.
예시 : 올바른 예시 embedding = [0.1, 0.2, 0.3, …] # 1024 개 요소 Dimension = 1024 로 설정된 테이블에 삽입 → 성공 icon:check-square[role=green] 잘못된 예시 embedding = [0.1, 0.2, 0.3, …] # 768 개 요소 Dimension = 1024 로 설정된 테이블에 삽입 → 오류 icon:times-square[role=red]

INT64 (64비트 정수)�

특징 :
  • 범위 : -9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807
  • 정수만 저장 : 소수점 없음
  • 고정 크기 : 8 bytes
사용 예시:
{
  "doc_id": 123456,
  "view_count": 1024,
  "user_age": 25,
  "timestamp": 1697547600
}
  • ID 가 숫자인 경우 int64 사용 권장 (string 보다 효율적 )
  • 카운트 , 순위 , 타임스탬프 등에 적합

DOUBLE (64비트 부동소수점)�

특징 :
  • 범위 : ±1.7E±308 (15~17 자리 정밀도 )
  • 소수점 저장 : 실수 값
  • 고정 크기 : 8 bytes
사용 예시 : “price”: 49.99, ” similarity _score ”: 0.9523, “latitude”: 37.5665, “probability”: 0.0001234
  • 통화 , 점수 , 좌표 등에 적합
  • 매우 작은 값이나 큰 값도 저장 가능

BOOLEAN (불리언)�

특징 :
  • 값 : true 또는 false
  • 고정 크기 : 1 byte
사용 예시 : ” is _published ”: true, ” is _deleted ”: false, ” has _embedding ”: true
  • 플래그 , 상태 표시에 적합
  • 필터링 조건으로 자주 사용됨

DIMENSION (벡터 차원 수)�

vector 타입 컬럼에서만 활성화되는 필드로 , 벡터의 차원 수를 지정합니다 . 표시 조건 :
  • Data Type = vector 일 때만 표시됨
  • Data Type ≠ vector 이면 자동으로 숨겨지고 값이 0 으로 초기화됨
화면 동작 예시 : 초기 상태 : Data Type: [string ▼] Dimension: ( 숨김 ) vector 선택 시 : Data Type: [vector ▼] Dimension: [____] ← 활성화 , 입력 필수 string 으로 다시 변경 : Data Type: [string ▼] Dimension: ( 숨김 , 자동으로 0 설정 ) 입력 범위 :
  • 최소값 : 1
  • 최대값 : 65536
  • 권장값 : 사용하는 임베딩 모델의 출력 차원과 동일
  • 벡터 DIMENSION 값은 반드시 16의 정수로 설정되어야 합니다.

ANN COLUMN (ANN 검색 인덱스 컬럼)�

주로 검색에 사용될 벡터 컬럼을 지정합니다 . 표시 조건 :
  • Data Type = vector 일 때만 체크박스 활성화
  • Data Type ≠ vector 이면 비활성화
제약 조건 :
  • 최대 1 개만 선택 가능 : 라디오 버튼처럼 동작
  • vector 타입 컬럼만 선택 가능
  • 선택 사항 : 현재 버전에서는 필수가 아님
ANN 컬럼의 역할 :
  • 벡터 검색 인덱스 구축 대상
  • 시맨틱 검색 시 사용되는 벡터
  • ANN 컬럼은 주로 검색에 사용될 벡터를 지정합니다
  • 일반적으로 embedding 컬럼을 ANN 컬럼으로 설정합니다
  • ANN 컬럼으로 지정하지 않은 vector 컬럼도 저장은 가능하지만 검색 인덱스는 구축되지 않습니다
  • 현재 버전에서는 ANN 컬럼 선택이 선택사항입니다’
  • 벡터 검색을 사용하려면 반드시 ANN 컬럼을 지정해야 합니다

PRIMARY Column (기본 키)��

각 행을 고유하게 식별하는 컬럼을 지정합니다 . 표시 조건 :
  • Data Type = string 일 때만 체크박스 활성화
  • Data Type ≠ string 이면 비활성화
제약 조건 :
  • 최대 1 개만 선택 가능 : 라디오 버튼처럼 동작
  • string 타입 컬럼만 선택 가능
  • 권장 : 정확히 1 개의 PRIMARY 컬럼 설정
  • 고유성 보장 : 중복된 값을 가질 수 없음
  • 행 식별 : UPDATE, DELETE 작업 시 사용
  • 인덱스 자동 생성 : 빠른 조회 가능
역할 :
  • 고유성 보장: 중복된 값을 가질 수 없음
  • 행 식별: UPDATE, DELETE 작업 시 사용
  • 인덱스 자동 생성: 빠른 조회 가능
  • 자원이 부족한 경우 테이블 생성이 불가 할 수 있습니다. 자원 확인은 운영자의 확인이 필요합니다.
  • 벡터 값이 16의 배수가 아닌 경우 테이블 생성이 불가합니다.