Faster & strong: string dictionary compression using sampling and fast vectorized decompression

R Lasch, I Oukid, R Dementiev, N May, SS Demirsoy… - The VLDB Journal, 2020 - Springer
String dictionaries constitute a large portion of the memory footprint of database
applications. While strong string dictionary compression algorithms exist, these come with …

Accelerating re-pair compression using FPGAs

R Lasch, SS Demirsoy, N May, V Ramamurthy… - Proceedings of the 16th …, 2020 - dl.acm.org
Re-Pair is a compression algorithm well-suited for applications that require random
accesses to compressed data, but has not found widespread use in the data management …

[PDF][PDF] Compression and Pattern Matching

T Kida, I Furuya - … Paradigm: Algorithmic Revolution in the Big …, 2022 - library.oapen.org
We introduce our research on compressed pattern matching technology that combines data
compression and pattern matching. To show the results of this work, we explain the collage …

簡潔索引を用いたVF 符号上の部分文字列抽出

笹川裕人, 関根渓, 吉田諭史, 喜田拓也 - 研究報告アルゴリズム(AL), 2014 - ipsj.ixsq.nii.ac.jp
論文抄録 本稿では, 可変長-固定長符号 (VF 符号) により符号化された圧縮テキストに対する,
高速な部分文字列抽出法を提案する. 提案手法では, 圧縮テキストに対して, 符号語の境界に対応 …

制約付きRe-Pair アルゴリズムと等価な半オンライン型置換アルゴリズム

正木拓也, 喜田拓也 - 研究報告アルゴリズム(AL), 2015 - ipsj.ixsq.nii.ac.jp
論文抄録 Re-Pair アルゴリズムは長さ n の入力テキストを O (n) 時間で等価な文法に変換する.
しかし, その動作はオフライン的であるのでテキスト全体を一度にメモリ上に読み込む必要がある …

制約付きRe-Pair に基づいた適応型ブロック伸長法によるデータ圧縮アルゴリズム

正木拓也, 喜田拓也 - 研究報告アルゴリズム(AL), 2015 - ipsj.ixsq.nii.ac.jp
論文抄録 Re-Pair アルゴリズムは, 入力テキスト長に対して線形時間で動作し,
優れた圧縮率を達成することのできる文法圧縮アルゴリズムである. ただし, その動作はオフライン的 …