sorami

Interested in tools for thought.

思考のための道具に興味があります。

note.com

NLPによる個人情報の仮名化: 民事判決のオープンデータ化へ向けた取り組みの紹介

Legalscape アドベントカレンダー 2021
sorami.dev

A People Map of Japan

gist.github.com

日常に潜むGISを見つけたい

speakerdeck.com

MapLibre, Svelte, Wikipediaデータを用いた地理空間情報可視化の事例

MIERUNE Meetup mini #01
zenn.dev

Elasticsearchで日本語を同義語展開する

Legalscape アドベントカレンダー 2021
note.com

「言語処理学会」の「年次大会」とはなにか: Legalscape は NLP2022 をスポンサーしています

Legalscape アドベントカレンダー 2021
speakerdeck.com

オープンソースとしての形態素解析器Sudachi

WAP NLP Tech Talk #4
zenn.dev

形態素解析の可視化ツール「ViSudachi」を使ってみる

gist.github.com

都道府県名の最初の漢字だけで表すことができる芸能人は「長島三奈」だけなのか

note.com

8万時間で自転車をつくる - メンバー紹介 久本 | Legalscape

zenn.dev

同義語検索ライブラリchikkarpyで独自の辞書を使う

shirokane-kougyou.fm

49. あなたの知らない「法律xNLP」の世界 | 白金鉱業.FM

zenn.dev

法令略称辞書: e-GovデータからSudachi同義語辞書を作成する

zenn.dev

Sudachi同義語辞書をElasticsearchで使う(暫定方法)

zenn.dev

形態素解析器Sudachiのユーザー辞書には文字正規化が必要

zenn.dev

形態素解析器Sudachiの「辞書」はどのように作られているか: 複数の分割単位を例として

zenn.dev

日本語単語ベクトル"chiVe"をgensimやMagnitudeで使う

yans.anlp.jp

形態素解析器Sudachiの複数粒度分割に基づく未知の複合語ベクトルの生成

久本空海, 勝田哲弘, 山村崇, 竹林佑斗, 高岡一馬, 内田佳孝, 岡照晃, 浅原正幸. NLP若手の会 (YANS) 第15回シンポジウム
yans.anlp.jp

詳細化した語彙関係をもつ同義語辞書を用いた日本語のRelation Embedding学習への取り組み

勝田哲弘, 山村崇, 竹林佑斗, 久本空海, 高岡一馬, 内田佳孝, 岡照晃, 浅原正幸. NLP若手の会 (YANS) 第15回シンポジウム
yans.anlp.jp

分散表現のドメイン適応へ向けた類似ドメインデータ検索

勝田哲弘, 山村崇, 勝田哲弘, 竹林佑斗, 久本空海, 高岡一馬, 内田佳孝, 岡照晃, 浅原正幸. NLP若手の会 (YANS) 第15回シンポジウム
yans.anlp.jp

選択肢提示型チャットボットのためのQAの自動シナリオ化へ向けて

竹林佑斗, 山村崇, 勝田哲弘, 久本空海, 高岡一馬, 内田佳孝. NLP若手の会 (YANS) 第15回シンポジウム
www.ieice.org

chiVe: 製品利用可能な日本語単語ベクトル資源の実現へ向けて

久本空海, 山村崇, 勝田哲弘, 竹林佑斗, 髙岡一馬, 内田佳孝, 岡照晃, 浅原正幸. (第16回テキストアナリティクス・シンポジウム)
speakerdeck.com

chiVe: 製品利用可能な日本語単語ベクトル資源の実現へ向けて

第16回テキストアナリティクス・シンポジウム
shirokane-kougyou.fm

36. 特別ゲスト@soramiさん(後編:ACL学会での発表論文と現在のNLPのホットトピック) | 白金鉱業.FM

shirokane-kougyou.fm

35. 特別ゲスト@soramiさん(前編:形態素解析器Sudachiについて) | 白金鉱業.FM

speakerdeck.com

Membership Inference Attacks on Sequence-to-Sequence Models: Is My Data In Your Machine Translation System?

ACL2020
www.anlp.jp

chiVe 2.0: SudachiとNWJCを用いた実用的な日本語単語ベクトルの実現に向けて

河村宗一郎, 久本空海, 真鍋陽俊, 髙岡一馬, 内田佳孝, 岡照晃, 浅原正幸. (言語処理学会第26回年次大会)
direct.mit.edu

Membership Inference Attacks on Sequence-to-Sequence Models: Is My Data In Your Machine Translation System?

Sorami Hisamoto, Matt Post, Kevin Duh. (TACL)
qiita.com

形態素解析器「Sudachi」の文字コードまわり

qiita.com

Rustによる自然言語処理ツールの実装: 形態素解析器「sudachi.rs」

自然言語処理 #2 Advent Calendar 2019
aclanthology.org

Robust Document Representations for Cross-Lingual Information Retrieval in Low-Resource Settings

Mahsa Yarmohammadi, Xutai Ma, Sorami Hisamoto, Muhammad Rahman, Yiming Wang, Hainan Xu, Daniel Povey, Philipp Koehn, Kevin Duh. (Machine Translation Summit 2019)
gist.github.com

ちくまプリマー新書 一覧情報取得

speakerdeck.com

Membership Inference Attacks on Sequence-to-Sequence Models

CLSP Seminar (Center for Language and Speech Processing, Johns Hopkins University)
arxiv.org

Query Expansion for Cross-Language Question Re-Ranking

Muhammad Mahbubur Rahman, Sorami Hisamoto, Kevin Duh. (arXiv preprint)
www.anlp.jp

User-Assisted Tabular Extraction in Japanese Invoice

Vincent Leonardo, Yuichiro Shimizu, Kensuke Masugata, Sorami Hisamoto, Yoshitaka Uchida, Kazuma Takaoka. (言語処理学会第25回年次大会)
repository.ninjal.ac.jp

形態素解析器『Sudachi』のための大規模辞書開発

坂本美保, 川原典子, 久本空海, 髙岡一馬, 内田佳孝. (国立国語研究所言語資源活用ワークショップ)
speakerdeck.com

Elasticsearchで今すぐ使えるビジネス向けトークナイザー『Sudachi』

Elasticsearch勉強会 in 京都
aclanthology.org

Sudachi: a Japanese Tokenizer for Business

Kazuma Takaoka, Sorami Hisamoto, Noriko Kawahara, Miho Sakamoto, Yoshitaka Uchida and Yuji Matsumoto. (LREC 2018)
anlp.jp

Information Extraction from English & Japanese Résumé with Neural Sequence Labelling Methods

Akihiro Katsuta, Hutama Adhi Hanjaya, Somnath Asati, Sorami Hisamoto, Kazuma Takaoka, Yoshitaka Uchida and Yuji Matsumoto. (言語処理学会第24回年次大会)
speakerdeck.com

DEEP NER: Neural Network Methods for Named Entity Recognition

WAP Tokushima Laboratory of AI and NLP
qiita.com

Elasticsearchのための新しい形態素解析器 「Sudachi」

Elastic stack (Elasticsearch) Advent Calendar 2017
qiita.com

データから 鉄道川柳 探したよ

speakerdeck.com

JuliaTokyo #6 Introduction

JuliaTokyo #6
speakerdeck.com

Dive into Probabilistic Programming: 確率的プログラミングどうでしょう

JuliaTokyo #6
gist.github.com

Finding "X-Tech" Candidates

qiita.com

さだとJuliaでLDA

Julia Advent Calendar 2015
speakerdeck.com

JuliaTokyo #5 Introduction

JuliaTokyo #5
qiita.com

「データサイエンティスト養成読本 機械学習入門編」(技術評論社, 2015)

speakerdeck.com

JuliaCon2015に行ってきました

JuliaTokyo #4
speakerdeck.com

What's going on at JuliaTokyo? ジュリア東京の活動報告

JuliaCon 2015
speakerdeck.com

トピックモデル

BrainPad AS^2 LT
qiita.com

"Seven More Languages in Seven Weeks"

Julia Advent Calendar 2014
gihyo.jp

技術計算のための新言語 Julia

『データサイエンティスト養成読本 R活用編』
www.slideshare.net

Japan.R 言語ディスカッション - Julia担当

Japan.R 2014
speakerdeck.com

[Tang+ 2014] "Understanding the Limiting Factors of Topic Modelling via Posterior Contraction Analysis"

BrainPad ICML2014読み会
speakerdeck.com

Juliaのこれまでとこれから

JuliaTokyo #1
speakerdeck.com

RとJulia

TokyoR #39 LT
speakerdeck.com

CW, AROW, and SCW

library.naist.jp

Synergies between Word Representation Learning and Dependency Parsing

Sorami Hisamoto (Master's Thesis)
speakerdeck.com

Babel Guide: 5 Languages in 13 Weeks

speakerdeck.com

Parsing The Web with Deep Learning: A Shallow Introduction

Rakuten Institute of Technology, New York
speakerdeck.com

Few Things on Scala: いらちのためのScala入門

aclanthology.org

Construction of English MWE Dictionary and its Application to POS Tagging

Yutaro Shigeto, Ai Azuma, Sorami Hisamoto, Shuhei Kondo, Tomoya Kouse, Keisuke Sakaguchi, Akifumi Yoshimoto, Frances Yung and Yuji Matsumoto. (NAACL2013 MWE Workshop)
speakerdeck.com

Perceptron, Support Vector Machine, and Passive Aggressive Algorithm.

www.anlp.jp

An Empirical Investigation of Word Representations for Parsing the Web

Sorami Hisamoto, Kevin Duh, and Yuji Matsumoto. (言語処理学会第19回年次大会)
nl-ipsj.or.jp

英語の複単語表現辞書の構築と品詞タグ付けへの応用

重藤優太郎, 東藍, 近藤修平, 北裏龍太, 坂口慶祐, 光瀬智哉, 久本空海, 吉本暁文, Frances Yung, 松本裕治. (情報処理学会研究報告第209回自然言語処理研究会)