Detecting Common Parts and Wrapper Generation for Multilingual Web Documents Using Alternation Counts (Data Mining/Data Warehousing)

Y YASUHIRO, I DAISUKE, H SACHIO - IPSJ Journal, 2004 - catalog.lib.kyushu-u.ac.jp
概要 We propose an algorithm to generate a wrapper which extracts contents of Web pages
written with the same template. First, the algorithm separates each page into template and …

Web シラバス情報収集エージェントの試作

山田信太郎, 松永吉広, 伊東栄典… - … 情報通信学会論文誌 D, 2003 - search.ieice.org
教育の情報化が進むにつれ, 講義内容を紹介するシラバス情報を Web ページとして提示する教育
組織が増えている. 本研究では, 各組織が独自に公開している Web 上のシラバス情報の抽出・統合 …

WWW からの情報抽出: Web ラッパーの自動構築(< 特集> WWW 上の情報の知的アクセスのためのテキスト処理)

山田泰寛, 池田大輔, 坂本比呂志, 有村博紀 - 人工知能, 2004 - jstage.jst.go.jp
1・1 WWW と情報抽出インターネット上には多種多様で膨大な量の情報が存在しており, 我々は PC
やモバイル端末, テレビなどの端末機器を利用して, これらの情報ヘアクセスできる. また, WWW …

事例に基づくシリーズ型HTML 文書の意味論理構造の自動認識HTML からXML への自動変換を目指して

梅原雅之, 岩沼宏治, 鍋島英知 - 人工知能学会論文誌, 2002 - jstage.jst.go.jp
抄録 The recognition and extraction of semantic/logical structures in HTML documents are
substantially important and difficult tasks for intelligent document processing. In this paper …

半構造化文書に対する木構造と文字列を組合せたラッパーの自動生成法

山田泰寛, 池田大輔… - 情報処理学会研究報告 …, 2003 - catalog.lib.kyushu-u.ac.jp
概要 同種の項目を多数含む半構造化文書群から, 各項目を抽出するラッパーの自動生成法を提案
する. 本手法では, まず部分文字列の長さと出現頻度に基づき, 半構造化文書を構造記述部分と …

事例ベース推論の動向(< 特集>「類似性に基づく推論」)

仲谷善雄 - 人工知能, 2002 - jstage.jst.go.jp
人間が間題に遭遇したとぎ過去に参考 1 こできるような類似の間題に遭遇した経験があるかどうか
をぢえるだろう. このような間題解決方法を [エピソード五亡憶に悲づく間題解決」 と呼ぶ [太 II] 88] …

Web シラバス群のデータ形式統合に関する考察

伊東栄典, 竇鈺峰, 廣川佐千男 - マルチメディア, 分散 …, 2004 - catalog.lib.kyushu-u.ac.jp
Web シラバス群のデータ形式統合に関する考察 Page 1 九州大学学術情報リポジトリ Kyushu
University Institutional Repository Web シラバス群のデータ形式統合に関する考察 伊東, 栄典 九州 …

Web からの同系統単語知識獲得についての実験

野口正人, 廣川佐千男 - 全国大会講演論文集, 2003 - catalog.lib.kyushu-u.ac.jp
概要 ある概念についての例を多数集めたいとき, 検索エンジンにその概念をキーワードとして与えて
も, 得られるのはそれに関連するページ群であり, 個別に単語を抜き出しまとめ直す作業が必要と …

[PDF][PDF] Web シラバス統合による教育情報ライブラリ構築

伊東栄典, 島松千春, 廣川佐千男 - ディジタル図書館, 2006 - tsukuba.repo.nii.ac.jp
概要高等教育機関でも情報化が進んでいる. 大学でもシラバスを Web 上に公開することが行なわ
れている. 教育機関のシラバス群は, その機関が提供する教育全体も表している. 更には …

表形式情報集約のための連想性の高いオブジェクトラベルの自動抽出方式

服部元, 松本一則, 菅谷史昭 - 電子情報通信学会論文誌 D, 2005 - search.ieice.org
近年, Web の情報量は爆発的に増加している. Web ページ中の個々の情報は値だけではなく表示
位置も変化する場合があり, 更にその更新頻度が高い特徴をもつ. そのためユーザが Web …