Databend Open Source 주간호 137

Databend는 최신 클라우드 데이터 웨어하우스입니다. 대규모 분석 요구 사항을 지원하기 위한 유연성과 효율성을 고려하여 설계되었습니다. 무료이며 오픈 소스입니다. 지금 클라우드 서비스를 경험해보세요: https://app.databend.cn .

Databend에 무슨 일이 일어나고 있나요?

이번 주 Databend의 새로운 개발을 살펴보고 마음에 더 가까운 Databend를 만나보세요.

쿼리 일치 반전 인덱스 지원

역색인은 문서 검색 시스템에서 가장 일반적으로 사용되는 데이터 구조로, 전체 텍스트 검색에서 문서 또는 문서 그룹의 단어 저장 위치 매핑을 저장하는 데 사용됩니다.

Databend는 이제 쿼리에서 match일치하는 반전된 인덱스를 지원합니다.

SELECT id, score(), content FROM t WHERE match(content, '中国') ORDER BY score()
----
21 1.1967509 中国的古代诗词充满了深邃的意境和独特的韵味,是中华文化的重要组成部分。
24 1.1967509 中国的传统节日蕴含着丰富的文化内涵,是传承和弘扬中华文化的重要途径。
28 1.3336442 中国的饮食文化博大精深,各地的美食各具特色,让人流连忘返。
12 1.4319203 北京的故宫是中国古代建筑的瑰宝,吸引了无数游客前来参观。
15 1.5059 中国的茶文化源远流长,品茶已经成为一种生活方式。

더 자세히 알고 싶으시면 언제든지 Databend 팀에 문의하시거나 아래 나열된 리소스를 확인하세요.

코드코너

Databend 및 주변 생태계의 코드 조각이나 프로젝트를 살펴보겠습니다.

TASK와 STREAM을 결합하여 실시간으로 사용자 활동을 캡처하고 추적합니다.

Databend의 스트림(STREAM)은 테이블 변경 사항을 동적으로 실시간으로 표현한 것입니다. 지속적인 분석을 위해 관련 테이블에 대한 수정 사항을 캡처하고 추적하는 스트림을 만듭니다. 작업은 미리 결정된 간격으로 실행되거나 특정 이벤트에 의해 트리거되거나 더 광범위한 작업 순서의 일부로 실행되도록 설계된 특정 SQL 문을 캡슐화합니다.

작업을 생성할 때 아래 워크플로에 따라 디자인할 수 있습니다.

다음 예에서는 TASK와 STREAM을 결합하여 사용자 활동을 실시간으로 캡처 및 추적하고 정기적으로 user_activity_profiles테이블을 activities_stream데이터 와 동기화하여 user_activity_profiles최신 사용자 활동을 항상 정확하게 반영하는 방법을 보여줍니다.

-- Define a task in Databend
CREATE TASK user_activity_task 
WAREHOUSE = 'default'
SCHEDULE = 1 MINUTE
-- Trigger task when new data arrives in activities_stream
WHEN stream_status('activities_stream') AS 
    -- Insert new records into user_activity_profiles
    INSERT INTO user_activity_profiles
    SELECT
        -- Join activities_stream with user_profiles based on user_id
        a.user_id, p.username, p.location, a.activity, a.timestamp
    FROM
        activities_stream AS a
        JOIN user_profiles AS p
            ON a.user_id = p.user_id
    -- Include only rows where the action is 'INSERT'
    WHERE a.change$action = 'INSERT';

관심 있는 분은 다음 문서를 읽고 Databend Cloud를 사용하여 이 작업을 완료하는 방법을 알아보세요.

하이라이트

다음은 몇 가지 주목할만한 이벤트입니다. 아마도 흥미로운 것을 찾을 수 있을 것입니다.

  • 지원 show viewsdesc view.
  • is_error, is_not_error, 기능을 추가했습니다 error_or.
  • task_history페이징을 지원합니다.
  • PRQL 쿼리 언어를 지원합니다.

다음은 무슨 일이야?

우리는 항상 최첨단 기술과 혁신적인 아이디어에 열려 있으며 커뮤니티에 참여하여 Databend에 활력을 불어넣는 것을 환영합니다.

CHANGES 절 지원

CHANGES 절을 사용하면 명시적인 트랜잭션 오프셋이 있는 스트림을 생성하지 않고도 지정된 간격 동안 테이블 또는 뷰의 변경 내용 추적 메타데이터를 쿼리할 수 있습니다.

여러 쿼리를 결합하면 서로 다른 트랜잭션 경계 사이의 변경 내용 추적 메타데이터를 검색하는 데 사용할 수 있습니다.

SELECT ...
FROM ...
   CHANGES ( INFORMATION => { DEFAULT | APPEND_ONLY } )
   AT ( { TIMESTAMP => <timestamp> | OFFSET => <time_difference> | STREAM => '<name>' } )
   [ END( { TIMESTAMP => <timestamp> | OFFSET => <time_difference> } ) ]
[ ... ]

문제 #15028 | 기능: CHANGES 절 지원

이 주제에 관심이 있다면 일부 문제를 해결해 보거나 토론 및 PR 리뷰에 참여할 수 있습니다. 또는 https://link.databend.rs/im-feeling-lucky 를 클릭하여 무작위 질문을 선택할 수도 있습니다. 행운을 빕니다!

새로운 기여자

커뮤니티에서 새로운 사람들을 만나보세요. Databend는 여러분 덕분에 더 나은 곳이 되었습니다.

변경 로그

최신 개발에 대한 최신 정보를 얻으려면 Databend의 일일 빌드에 대한 변경 로그를 확인하세요.

주소: https://github.com/datafuselabs/databend/releases

기여자

이번주에도 훌륭한 작업을 해주신 기고자들에게 깊은 감사를 드립니다.

우리와 접촉

Databend는 실시간 분석도 수행할 수 있는 개체 스토리지 기반의 유연하고 저렴한 오픈 소스 새로운 데이터 웨어하우스입니다. 차세대 오픈 소스 데이터 클라우드를 만들기 위해 여러분의 관심과 클라우드 네이티브 데이터 웨어하우스 솔루션을 함께 탐색해 보시기를 기대합니다.

Linus는 커널 개발자가 탭을 공백으로 대체하는 것을 막기 위해 문제를 직접 해결했습니다. 그의 아버지는 코드를 작성할 수 있는 몇 안 되는 리더 중 한 명이고, 둘째 아들은 오픈 소스 기술 부서의 책임자이며, 막내 아들은 핵심입니다. Huawei: 일반적으로 사용되는 모바일 애플리케이션 5,000개를 변환하는 데 1년이 걸렸습니다. Hongmeng으로의 포괄적인 마이그레이션 Java는 타사 취약점에 가장 취약한 언어입니다. Hongmeng의 아버지인 Wang Chenglu: 오픈 소스 Hongmeng은 유일한 아키텍처 혁신입니다. 중국 기초 소프트웨어 분야의 마화텅(Ma Huateng)과 저우홍이(Zhou Hongyi)가 악수를 하며 "원한을 풀다" 전 마이크로소프트 개발자: 윈도우 11 성능은 "터무니없을 정도로 나쁘다" 라오샹지가 오픈소스인 것은 코드는 아니지만 그 이유는 다음과 같다. Google이 대규모 구조 조정을 발표 했습니다 .
{{o.이름}}
{{이름}}

추천

출처my.oschina.net/u/5489811/blog/11049092