sorami

Interested in tools for thought.

思考のための道具に興味があります。

www.jstage.jst.go.jp

日本語における評価用データセットの構築と利用性の向上―JED2022 ワークショップの成果と展望

松田寛, 柴田知秀, 河原大輔, 久本空海, 久保隆宏, 浅原正幸. (『自然言語処理』29巻3号)
observablehq.com

MIERUNE社内ハンズオン2022: Observable & D3.js

note.com

「自然言語処理」から「相乗りサービス」、「3D地図」まで盛り沢山! - MIERUNE Meetup mini #4 を開催しました

speakerdeck.com

北海道でGIS

MIERUNE Meetup mini #04
sorami.dev

HOKKAIDLE

observablehq.com

北海道のTopoJSON: 札幌市の区をマージ

observablehq.com

Japanese from Hokkaido to Okinawa

observablehq.com

Street Voronoi of Hokkaido

observablehq.com

簡略化した日本国土の図 / Simplified Japan

observablehq.com

鉛筆スケッチ風な日本国土の図 / Pencil Sketch-ish Japan

observablehq.com

Graticule with {Mapbox, MapLibre} GL JS

observablehq.com

近隣10軒のセイコーマート

speakerdeck.com

インタラクティブなメディアの地図投影法: WebメルカトルからAdaptive Projectionsへ

MIERUNE 社内勉強会 #033
observablehq.com

Adaptive Projections (Mapbox GL JS v2.6)

observablehq.com

Sizes of large Language Models

www.anlp.jp

民事判決のオープンデータ化へ向けた機械処理による判例仮名化の検証

久本空海, 城戸祐亮, 津金澤佳亨, 八木田樹. (言語処理学会第28回年次大会)
zenn.dev

Sudachiで馬謖を切る: 形態素解析の可視化とユーザー辞書による制御

note.com

NLPによる個人情報の仮名化: 民事判決のオープンデータ化へ向けた取り組みの紹介

Legalscape アドベントカレンダー 2021
sorami.dev

A People Map of Japan

gist.github.com

日常に潜むGISを見つけたい

speakerdeck.com

MapLibre, Svelte, Wikipediaデータを用いた地理空間情報可視化の事例

MIERUNE Meetup mini #01
zenn.dev

Elasticsearchで日本語を同義語展開する

Legalscape アドベントカレンダー 2021
note.com

「言語処理学会」の「年次大会」とはなにか: Legalscape は NLP2022 をスポンサーしています

Legalscape アドベントカレンダー 2021
speakerdeck.com

オープンソースとしての形態素解析器Sudachi

WAP NLP Tech Talk #4
zenn.dev

形態素解析の可視化ツール「ViSudachi」を使ってみる

gist.github.com

都道府県名の最初の漢字だけで表すことができる芸能人は「長島三奈」だけなのか

note.com

8万時間で自転車をつくる - メンバー紹介 久本 | Legalscape

zenn.dev

同義語検索ライブラリchikkarpyで独自の辞書を使う

shirokane-kougyou.fm

49. あなたの知らない「法律xNLP」の世界 | 白金鉱業.FM

zenn.dev

法令略称辞書: e-GovデータからSudachi同義語辞書を作成する

zenn.dev

Sudachi同義語辞書をElasticsearchで使う(暫定方法)

zenn.dev

形態素解析器Sudachiのユーザー辞書には文字正規化が必要

zenn.dev

形態素解析器Sudachiの「辞書」はどのように作られているか: 複数の分割単位を例として

zenn.dev

日本語単語ベクトル"chiVe"をgensimやMagnitudeで使う

yans.anlp.jp

形態素解析器Sudachiの複数粒度分割に基づく未知の複合語ベクトルの生成

久本空海, 勝田哲弘, 山村崇, 竹林佑斗, 高岡一馬, 内田佳孝, 岡照晃, 浅原正幸. NLP若手の会 (YANS) 第15回シンポジウム
yans.anlp.jp

詳細化した語彙関係をもつ同義語辞書を用いた日本語のRelation Embedding学習への取り組み

勝田哲弘, 山村崇, 竹林佑斗, 久本空海, 高岡一馬, 内田佳孝, 岡照晃, 浅原正幸. NLP若手の会 (YANS) 第15回シンポジウム
yans.anlp.jp

分散表現のドメイン適応へ向けた類似ドメインデータ検索

勝田哲弘, 山村崇, 勝田哲弘, 竹林佑斗, 久本空海, 高岡一馬, 内田佳孝, 岡照晃, 浅原正幸. NLP若手の会 (YANS) 第15回シンポジウム
yans.anlp.jp

選択肢提示型チャットボットのためのQAの自動シナリオ化へ向けて

竹林佑斗, 山村崇, 勝田哲弘, 久本空海, 高岡一馬, 内田佳孝. NLP若手の会 (YANS) 第15回シンポジウム
www.ieice.org

chiVe: 製品利用可能な日本語単語ベクトル資源の実現へ向けて

久本空海, 山村崇, 勝田哲弘, 竹林佑斗, 髙岡一馬, 内田佳孝, 岡照晃, 浅原正幸. (第16回テキストアナリティクス・シンポジウム)
speakerdeck.com

chiVe: 製品利用可能な日本語単語ベクトル資源の実現へ向けて

第16回テキストアナリティクス・シンポジウム
shirokane-kougyou.fm

36. 特別ゲスト@soramiさん(後編:ACL学会での発表論文と現在のNLPのホットトピック) | 白金鉱業.FM

shirokane-kougyou.fm

35. 特別ゲスト@soramiさん(前編:形態素解析器Sudachiについて) | 白金鉱業.FM

speakerdeck.com

Membership Inference Attacks on Sequence-to-Sequence Models: Is My Data In Your Machine Translation System?

ACL2020
www.anlp.jp

chiVe 2.0: SudachiとNWJCを用いた実用的な日本語単語ベクトルの実現に向けて

河村宗一郎, 久本空海, 真鍋陽俊, 髙岡一馬, 内田佳孝, 岡照晃, 浅原正幸. (言語処理学会第26回年次大会)
direct.mit.edu

Membership Inference Attacks on Sequence-to-Sequence Models: Is My Data In Your Machine Translation System?

Sorami Hisamoto, Matt Post, Kevin Duh. (TACL)
qiita.com

形態素解析器「Sudachi」の文字コードまわり

qiita.com

Rustによる自然言語処理ツールの実装: 形態素解析器「sudachi.rs」

自然言語処理 #2 Advent Calendar 2019
aclanthology.org

Robust Document Representations for Cross-Lingual Information Retrieval in Low-Resource Settings

Mahsa Yarmohammadi, Xutai Ma, Sorami Hisamoto, Muhammad Rahman, Yiming Wang, Hainan Xu, Daniel Povey, Philipp Koehn, Kevin Duh. (Machine Translation Summit 2019)
gist.github.com

ちくまプリマー新書 一覧情報取得

speakerdeck.com

Membership Inference Attacks on Sequence-to-Sequence Models

CLSP Seminar (Center for Language and Speech Processing, Johns Hopkins University)
arxiv.org

Query Expansion for Cross-Language Question Re-Ranking

Muhammad Mahbubur Rahman, Sorami Hisamoto, Kevin Duh. (arXiv preprint)
www.anlp.jp

User-Assisted Tabular Extraction in Japanese Invoice

Vincent Leonardo, Yuichiro Shimizu, Kensuke Masugata, Sorami Hisamoto, Yoshitaka Uchida, Kazuma Takaoka. (言語処理学会第25回年次大会)
repository.ninjal.ac.jp

形態素解析器『Sudachi』のための大規模辞書開発

坂本美保, 川原典子, 久本空海, 髙岡一馬, 内田佳孝. (国立国語研究所言語資源活用ワークショップ)
speakerdeck.com

Elasticsearchで今すぐ使えるビジネス向けトークナイザー『Sudachi』

Elasticsearch勉強会 in 京都
aclanthology.org

Sudachi: a Japanese Tokenizer for Business

Kazuma Takaoka, Sorami Hisamoto, Noriko Kawahara, Miho Sakamoto, Yoshitaka Uchida and Yuji Matsumoto. (LREC 2018)
anlp.jp

Information Extraction from English & Japanese Résumé with Neural Sequence Labelling Methods

Akihiro Katsuta, Hutama Adhi Hanjaya, Somnath Asati, Sorami Hisamoto, Kazuma Takaoka, Yoshitaka Uchida and Yuji Matsumoto. (言語処理学会第24回年次大会)
speakerdeck.com

DEEP NER: Neural Network Methods for Named Entity Recognition

WAP Tokushima Laboratory of AI and NLP
qiita.com

Elasticsearchのための新しい形態素解析器 「Sudachi」

Elastic stack (Elasticsearch) Advent Calendar 2017
qiita.com

データから 鉄道川柳 探したよ

speakerdeck.com

JuliaTokyo #6 Introduction

JuliaTokyo #6
speakerdeck.com

Dive into Probabilistic Programming: 確率的プログラミングどうでしょう

JuliaTokyo #6
gist.github.com

Finding "X-Tech" Candidates

qiita.com

さだとJuliaでLDA

Julia Advent Calendar 2015
speakerdeck.com

JuliaTokyo #5 Introduction

JuliaTokyo #5
qiita.com

「データサイエンティスト養成読本 機械学習入門編」(技術評論社, 2015)

speakerdeck.com

JuliaCon2015に行ってきました

JuliaTokyo #4
speakerdeck.com

What's going on at JuliaTokyo? ジュリア東京の活動報告

JuliaCon 2015
speakerdeck.com

トピックモデル

BrainPad AS^2 LT
qiita.com

"Seven More Languages in Seven Weeks"

Julia Advent Calendar 2014
gihyo.jp

技術計算のための新言語 Julia

『データサイエンティスト養成読本 R活用編』
www.slideshare.net

Japan.R 言語ディスカッション - Julia担当

Japan.R 2014
speakerdeck.com

[Tang+ 2014] "Understanding the Limiting Factors of Topic Modelling via Posterior Contraction Analysis"

BrainPad ICML2014読み会
speakerdeck.com

Juliaのこれまでとこれから

JuliaTokyo #1
speakerdeck.com

RとJulia

TokyoR #39 LT
speakerdeck.com

CW, AROW, and SCW

library.naist.jp

Synergies between Word Representation Learning and Dependency Parsing

Sorami Hisamoto (Master's Thesis)
speakerdeck.com

Babel Guide: 5 Languages in 13 Weeks

speakerdeck.com

Parsing The Web with Deep Learning: A Shallow Introduction

Rakuten Institute of Technology, New York
speakerdeck.com

Few Things on Scala: いらちのためのScala入門

aclanthology.org

Construction of English MWE Dictionary and its Application to POS Tagging

Yutaro Shigeto, Ai Azuma, Sorami Hisamoto, Shuhei Kondo, Tomoya Kouse, Keisuke Sakaguchi, Akifumi Yoshimoto, Frances Yung and Yuji Matsumoto. (NAACL2013 MWE Workshop)
speakerdeck.com

Perceptron, Support Vector Machine, and Passive Aggressive Algorithm.

www.anlp.jp

An Empirical Investigation of Word Representations for Parsing the Web

Sorami Hisamoto, Kevin Duh, and Yuji Matsumoto. (言語処理学会第19回年次大会)
nl-ipsj.or.jp

英語の複単語表現辞書の構築と品詞タグ付けへの応用

重藤優太郎, 東藍, 近藤修平, 北裏龍太, 坂口慶祐, 光瀬智哉, 久本空海, 吉本暁文, Frances Yung, 松本裕治. (情報処理学会研究報告第209回自然言語処理研究会)