sorami
Interested in tools for thought.
思考のための道具に興味があります。
CSSを積み重ねる - 2024年のMasonry Layout
Webでの多彩な表現へ向けての標準化
可視化がやりたくてMIERUNEに転職した話
“思考のための道具”とコンピューターによる新たな表現
「日本で最も丸い湖」を探して
GIS, 円形度, 最急降下法
科学技術コミュ日記
北海道大学CoSTEP(科学技術コミュニケーター養成プログラム)
「スクローリーテリング」から考えるジューシーなメディア
Juice it
都市名しりとり
札幌→ロンドン→ンジャメナ→...
数々の多様性
バベルの塔と思考のための道具
Vue.jsと3D可視化 - 産総研のOSS「AIST 3DDB Client」を例に
Vue Fes Japan 2023
カクトビック数字 - 人間と文化にあわせた多様な表現の可能性
5-20進法
データ可視化をやりたくて北海道に移住した話
人生
めくるめくスクロールとデータ可視化の世界
scroll + storytelling
東海道中スクロール栗毛
scrollytelling
私を(GISで)スキーに連れてって
これがFOSS4G
World Ski Resorts - voronoi
スキー場ボロノイ図
地図と可視化とコミュニティ
それと言語
Gazetteer of Japan (地名集日本)
地理院データを餅から米
Japanese from Hokkaido to Okinawa
緯度で都市の人口
北海道でGIS
北の大地で地理空間情報
HOKKAIDLE
北海道の市町村を地図で当てるゲーム
インタラクティブなメディアの地図投影法
Adaptive Projectionsの解説
NLPによる個人情報の仮名化
民事判決のオープンデータ化へ向けた取り組み
A People Map of Japan
地名を出身人物に置き換えた地図
MapLibre, Svelte, Wikipediaデータを用いた地理空間情報可視化の事例
GIS完全に理解した
オープンソースとしての形態素解析器Sudachi
人生を変えるOSS
形態素解析器Sudachiの「辞書」はどのように作られているか
複数の分割単位を例として
chiVe: 製品利用可能な日本語単語ベクトル資源の実現へ向けて
「ちゃいゔ」
Membership Inference Attacks on Sequence-to-Sequence Models
機械翻訳モデルへの攻撃
Sudachi ♡ Elasticsearch
ビジネス向けトークナイザー
What's going on at JuliaTokyo?
ジュリア東京の活動報告
Parsing The Web with Deep Learning
単語分散表現と構文解析の試み
2024
法律から見る日本の寒い地域: 「国家公務員の寒冷地手当」地図
MIERUNE アドベントカレンダー 2024
Web技術の祭典「JSConf JP 2024」参加レポート: Three.jsから実サービス事例まで、面白かった発表の紹介
CSSを積み重ねる - 2024年のMasonry Layout
MIERUNE 朝LT
AWS Amplify + Bun + Svelte のビルド設定
”データを自在に可視化する極意”を、『データ可視化の基本が全部わかる本』著者の矢崎裕一さんに学ぶ: 「データビジュアライゼーション講習」レポート
【🛣️ MIERUNE JCT - Tokyo 2024 🗼】 位置情報の話題でワイワイやる会を東京で初開催しました!
可視化がやりたくてMIERUNEに転職した話 〜“思考のための道具”とコンピューターによる新たな表現〜
MIERUNE JCT - Tokyo 2024
Web地図のためのサーバーサイド技術の勘所をつかむ — 『位置情報デベロッパー養成講座』(#位置デベ本)書評
Scrollytelling the 53 Stations of Tōkaidō: An Interactive Journey Through Japan’s Historic Route
BUILD with Mapbox 2024 - Developer Show & Tell
住所に用いられる文字のカウント
北海道の旭川で開催されたカンファレンス「TechRAMEN 2024」のスポンサーになり、参加・登壇して、合宿もしてきました!
データ可視化をやりたくて北海道におひっこし
TechRAMEN 2024 Conference
QGISでオーストラリアを四国にする
Svelte採用記 - 位置情報と可視化の会社で、全社の標準技術スタックに選ぶまで
Svelte Japan Online Meetup #3
EPSG or JPX
EPSGコードか、証券コードか
18. CoSTEPに1年間通ってみてどうでしたか?(sorami)
サウナ!暖炉!対話! 全社オフサイト 「MIERUNE CAMP」レポート 🏕️
17. 劣化するインターネットと個人主義ユートピア, コミュニケーションの適度な距離感(sorami)
界隈.chat
「日本で最も丸い湖」を探して - GIS, 円形度, 最急降下法
NLP2024(言語処理学会 第30回年次大会)レポート: テーマセッション「ことばと地理空間の情報処理」共同提案者・プログラム委員として参加しました!
おしまい - 科学技術コミュ日記
トピックごとの目次 - 科学技術コミュ日記
企画展示「ななめせんなめせん」 - 科学技術コミュ日記
1月と2月の活動 - 科学技術コミュ日記
モジュール6講義 - 科学技術コミュ日記
Hokkaido, Japan - population, cow, fish, wheat, snowfall
Human & Cow population in Japan (Cartogram)
Snowfall in Japan
2023
「スクローリーテリング」から考えるジューシーなメディア
Data Visualization Japan Meetup 2023
11月と12月の活動、モジュール5講義 - 科学技術コミュ日記
Map of Japan with Observable Plot
Human & Cow population in Japan (Bivariate choropleth)
アジアでオープンなジオの祭典: 「FOSS4G ASIA 2023」に参加&発表してきました!
MIERUNE アドベントカレンダー 2023
AIST 3DDB Client: an open-source web application for the 3D database
FOSS4G ASIA 2023
ChatGPTと高次元科学 - 科学技術コミュ日記
In between - 科学技術コミュ日記
情報技術による新たな議論形式の模索 - 科学技術コミュ日記
モジュール3講義、9月と10月の活動 - 科学技術コミュ日記
都市名しりとり
国内で例が少ないビジネスを展開する株式会社MIERUNEのオープン・アクティブな文化
ミライのお仕事
カクトビック数字と、数々の多様性 - 科学技術コミュ日記
数々の多様性
CoSTEP プレゼン演習 #2
Vue.jsと3D可視化 - 産総研のOSS「AIST 3DDB Client」を例に
Vue Fes Japan 2023
カクトビック数字 - 人間と文化にあわせた多様な表現の可能性 / Kaktovik Numerals
CoSTEP プレゼン演習 #1
「サイエンスイラストレーション」という手法 - 科学技術コミュ日記
7月と8月の講義・演習・実習 - 科学技術コミュ日記
11. 無駄と遊び心 (Yfuru2454)
界隈.chat
12. 昆虫標本としてのPodcast (Yfuru2454)
界隈.chat
AIST 3DDB Client: 産総研3DデータベースのためのオープンソースWebアプリ
FOSS4G 2023 Japan@FUKUI
いろんな人々が流入するユルいオンラインイベント「MIERUNE JCT #01」を開催しました 🛣️
10. Podcasterの聖地「雑談」に行ってきた (sorami)
界隈.chat
9. 複雑なものを複雑なまま扱う:高次元科学について語ろう (sorami)
界隈.chat
MIERUNE/mokumoku-wordcloud: もくもく会 💯 🎉 ワードクラウド
日本語話者だけが読めない地図
QGISで雲がかかった「天国から視点」っぽい画像を作る
モジュール1-2「先端科学技術の倫理的・法的・社会的課題と責任ある研究・イノベーション」(5/27)標葉隆馬先生講義レポート
科学技術に関わる活動が専門家のみで行われることの限界? - 科学技術コミュ日記
Yahoo! JAPAN 人流データ活用 〜ビックデータの処理と可視化〜
MIERUNE MEETUP 2023
ファビコンを環境ごとに変えると分かりやすい(Next.js, Vue3, SvelteKit, Astro)
データ可視化をやりたくて北海道に移住した話
SaCSS Season 2 Vol. 2
この日記はどう作られているか - 科学技術コミュ日記
めくるめくスクロールとデータ可視化の世界 - 「スクローリーテリング」ってなに?
MIERUNE BBQ #02
動物倫理、コミュニケーション、ファシリテーション - 科学技術コミュ日記
2. LLMについて好き勝手語る (sorami)
界隈.chat
科学技術コミュニケーターとCoSTEPのできること - 科学技術コミュ日記
大きなもの、小さなもの、沢山のもの - 科学技術コミュ日記
1. 久しぶりの近況報告。soramiさんが通ってる面白い学校 (sorami)
界隈.chat
「札幌市電」を貸し切ったら、社員全員でなまら盛り上がった話 🚋
背景画像(壁紙)を素敵なものにしてくれるアプリ(ブラウザ, macOS, Windows)
書くことについて - 科学技術コミュ日記
Next.js 13 で deck.gl 8.9 を使う時の、モジュール読み込み(ESM)の設定
温室で青写真 / 科学者と価値判断 - 科学技術コミュ日記
北大祭で科研費を争奪 - 科学技術コミュ日記
もくもくと書いていきたい - 科学技術コミュ日記
まずはズレをわかりたい - 科学技術コミュ日記
伝えるけど伝わらない - 科学技術コミュ日記
インタビューが楽しい - 科学技術コミュ日記
みんなの話を聴きたい - 科学技術コミュ日記
ハワイにある「広島・ホノルル友好鳥居」はどこを向いているのか
Where is the “Hiroshima to Honolulu Friendship Torii” in Hawaii facing?
人の話を聴いていない - 科学技術コミュ日記
科学技術を押し売りしない - 科学技術コミュ日記
はじまりはじまり - 科学技術コミュ日記
CoSTEP前夜 - 科学技術コミュ日記
Suzuki Cat Generator
東海道中スクロール栗毛
Scrollytelling the 53 Stations of the Tōkaidō in Japan.
沖縄とChatGPT、 地理空間と言語処理: NLP2023(言語処理学会 第29回年次大会)レポート
「言語処理学会 年次大会」 開催一覧
場所参照表現と位置情報を紐付けるジオコーディングの概観と発展に向けての考察
久本空海, 西尾悟, 井口奏大, 古川泰人, 大友寛之, 東山翔平, 大内啓樹. (言語処理学会第29回年次大会)
場所参照表現と位置情報を紐付けるジオコーディングの概観と発展に向けての考察
言語処理学会第29回年次大会(NLP2023)
Webで地図を作ってみたいけど、どこから始めればいいかわからないアナタへ — 『位置情報エンジニア養成講座』(#位置エン本)書評
私を(GISで)スキーに連れてって
FOSS4G Hokkaido mini #01
World Ski Resorts - voronoi
World Ski Resorts - nearest neighbors
OpenStreetMap - "landuse = winter_sports"
2022
地図と可視化とコミュニティ(それと言語)
Data Visualization Japan Meetup 2022
国土地理院「地名集日本」を餅から米
MIERUNE アドベントカレンダー 2022
「ポケモンGO」や「酪農」、「スマホ位置情報」などのLT大会! - MIERUNE Meetup mini #05 を開催しました
Gazetteer of Japan (地名集日本)
30日間で30の地図をつくりました! 30DayMapChallenge 2022
MIERUNE 30DayMapChallenge: 21日目「人口データ(Data: Kontur Population Dataset)」
Population of Hokkaido, Japan: 400m H3 Hexagons (Kontur)
QGISにおける「.qgs」と「.qgz」拡張子の違い
63. あなたの知らない「位置情報xOSSxオープンデータ」の世界(前編)
白金鉱業.FM
64. あなたの知らない「位置情報xOSSxオープンデータ」の世界(後編)
白金鉱業.FM
都道府県GeoJSONのポリゴンをフィルタリング
日本語における評価用データセットの構築と利用性の向上―JED2022 ワークショップの成果と展望
松田寛, 柴田知秀, 河原大輔, 久本空海, 久保隆宏, 浅原正幸. (『自然言語処理』29巻3号)
MIERUNE社内ハンズオン2022: Observable & D3.js
「自然言語処理」から「相乗りサービス」、「3D地図」まで盛り沢山! - MIERUNE Meetup mini #4 を開催しました
北海道でGIS
MIERUNE Meetup mini #04
HOKKAIDLE
北海道のTopoJSON: 札幌市の区をマージ
Japanese from Hokkaido to Okinawa
Street Voronoi of Hokkaido
簡略化した日本国土の図 / Simplified Japan
鉛筆スケッチ風な日本国土の図 / Pencil Sketch-ish Japan
Graticule with {Mapbox, MapLibre} GL JS
近隣10軒のセイコーマート
インタラクティブなメディアの地図投影法: WebメルカトルからAdaptive Projectionsへ
MIERUNE 社内勉強会 #033
Adaptive Projections (Mapbox GL JS v2.6)
Sizes of large Language Models
民事判決のオープンデータ化へ向けた機械処理による判例仮名化の検証
久本空海, 城戸祐亮, 津金澤佳亨, 八木田樹. (言語処理学会第28回年次大会)
Sudachiで馬謖を切る: 形態素解析の可視化とユーザー辞書による制御
2021
NLPによる個人情報の仮名化: 民事判決のオープンデータ化へ向けた取り組みの紹介
Legalscape アドベントカレンダー 2021
A People Map of Japan
日常に潜むGISを見つけたい
MapLibre, Svelte, Wikipediaデータを用いた地理空間情報可視化の事例
MIERUNE Meetup mini #01
Elasticsearchで日本語を同義語展開する
Legalscape アドベントカレンダー 2021
「言語処理学会」の「年次大会」とはなにか: Legalscape は NLP2022 をスポンサーしています
Legalscape アドベントカレンダー 2021
オープンソースとしての形態素解析器Sudachi
WAP NLP Tech Talk #4
形態素解析の可視化ツール「ViSudachi」を使ってみる
都道府県名の最初の漢字だけで表すことができる芸能人は「長島三奈」だけなのか
8万時間で自転車をつくる - メンバー紹介 久本 | Legalscape
同義語検索ライブラリchikkarpyで独自の辞書を使う
49. あなたの知らない「法律xNLP」の世界
白金鉱業.FM
法令略称辞書: e-GovデータからSudachi同義語辞書を作成する
Sudachi同義語辞書をElasticsearchで使う(暫定方法)
形態素解析器Sudachiのユーザー辞書には文字正規化が必要
2020
形態素解析器Sudachiの「辞書」はどのように作られているか: 複数の分割単位を例として
日本語単語ベクトル"chiVe"をgensimやMagnitudeで使う
形態素解析器Sudachiの複数粒度分割に基づく未知の複合語ベクトルの生成
久本空海, 勝田哲弘, 山村崇, 竹林佑斗, 高岡一馬, 内田佳孝, 岡照晃, 浅原正幸. NLP若手の会 (YANS) 第15回シンポジウム
詳細化した語彙関係をもつ同義語辞書を用いた日本語のRelation Embedding学習への取り組み
勝田哲弘, 山村崇, 竹林佑斗, 久本空海, 高岡一馬, 内田佳孝, 岡照晃, 浅原正幸. NLP若手の会 (YANS) 第15回シンポジウム
分散表現のドメイン適応へ向けた類似ドメインデータ検索
勝田哲弘, 山村崇, 勝田哲弘, 竹林佑斗, 久本空海, 高岡一馬, 内田佳孝, 岡照晃, 浅原正幸. NLP若手の会 (YANS) 第15回シンポジウム
選択肢提示型チャットボットのためのQAの自動シナリオ化へ向けて
竹林佑斗, 山村崇, 勝田哲弘, 久本空海, 高岡一馬, 内田佳孝. NLP若手の会 (YANS) 第15回シンポジウム
chiVe: 製品利用可能な日本語単語ベクトル資源の実現へ向けて
久本空海, 山村崇, 勝田哲弘, 竹林佑斗, 髙岡一馬, 内田佳孝, 岡照晃, 浅原正幸. (第16回テキストアナリティクス・シンポジウム)
chiVe: 製品利用可能な日本語単語ベクトル資源の実現へ向けて
第16回テキストアナリティクス・シンポジウム
36. 特別ゲスト@soramiさん(後編:ACL学会での発表論文と現在のNLPのホットトピック)
白金鉱業.FM
35. 特別ゲスト@soramiさん(前編:形態素解析器Sudachiについて)
白金鉱業.FM
Membership Inference Attacks on Sequence-to-Sequence Models: Is My Data In Your Machine Translation System?
ACL2020
chiVe 2.0: SudachiとNWJCを用いた実用的な日本語単語ベクトルの実現に向けて
河村宗一郎, 久本空海, 真鍋陽俊, 髙岡一馬, 内田佳孝, 岡照晃, 浅原正幸. (言語処理学会第26回年次大会)
Membership Inference Attacks on Sequence-to-Sequence Models: Is My Data In Your Machine Translation System?
Sorami Hisamoto, Matt Post, Kevin Duh. (TACL)
2019
形態素解析器「Sudachi」の文字コードまわり
Rustによる自然言語処理ツールの実装: 形態素解析器「sudachi.rs」
自然言語処理 #2 Advent Calendar 2019
Robust Document Representations for Cross-Lingual Information Retrieval in Low-Resource Settings
Mahsa Yarmohammadi, Xutai Ma, Sorami Hisamoto, Muhammad Rahman, Yiming Wang, Hainan Xu, Daniel Povey, Philipp Koehn, Kevin Duh. (Machine Translation Summit 2019)
ちくまプリマー新書 一覧情報取得
Membership Inference Attacks on Sequence-to-Sequence Models
CLSP Seminar (Center for Language and Speech Processing, Johns Hopkins University)
Query Expansion for Cross-Language Question Re-Ranking
Muhammad Mahbubur Rahman, Sorami Hisamoto, Kevin Duh. (arXiv preprint)
User-Assisted Tabular Extraction in Japanese Invoice
Vincent Leonardo, Yuichiro Shimizu, Kensuke Masugata, Sorami Hisamoto, Yoshitaka Uchida, Kazuma Takaoka. (言語処理学会第25回年次大会)
2018
形態素解析器『Sudachi』のための大規模辞書開発
坂本美保, 川原典子, 久本空海, 髙岡一馬, 内田佳孝. (国立国語研究所言語資源活用ワークショップ)
Elasticsearchで今すぐ使えるビジネス向けトークナイザー『Sudachi』
Elasticsearch勉強会 in 京都
Sudachi: a Japanese Tokenizer for Business
Kazuma Takaoka, Sorami Hisamoto, Noriko Kawahara, Miho Sakamoto, Yoshitaka Uchida and Yuji Matsumoto. (LREC 2018)
Information Extraction from English & Japanese Résumé with Neural Sequence Labelling Methods
Akihiro Katsuta, Hutama Adhi Hanjaya, Somnath Asati, Sorami Hisamoto, Kazuma Takaoka, Yoshitaka Uchida and Yuji Matsumoto. (言語処理学会第24回年次大会)
2017
DEEP NER: Neural Network Methods for Named Entity Recognition
WAP Tokushima Laboratory of AI and NLP
Elasticsearchのための新しい形態素解析器 「Sudachi」
Elastic stack (Elasticsearch) Advent Calendar 2017
データから 鉄道川柳 探したよ
2016
JuliaTokyo #6 Introduction
JuliaTokyo #6
Dive into Probabilistic Programming: 確率的プログラミングどうでしょう
JuliaTokyo #6
Finding "X-Tech" Candidates
2015
さだとJuliaでLDA
Julia Advent Calendar 2015
JuliaTokyo #5 Introduction
JuliaTokyo #5
「データサイエンティスト養成読本 機械学習入門編」(技術評論社, 2015)
JuliaCon2015に行ってきました
JuliaTokyo #4
What's going on at JuliaTokyo? ジュリア東京の活動報告
JuliaCon 2015
トピックモデル
BrainPad AS^2 LT
2014
"Seven More Languages in Seven Weeks"
Julia Advent Calendar 2014
技術計算のための新言語 Julia
『データサイエンティスト養成読本 R活用編』
Japan.R 言語ディスカッション - Julia担当
Japan.R 2014
[Tang+ 2014] "Understanding the Limiting Factors of Topic Modelling via Posterior Contraction Analysis"
BrainPad ICML2014読み会
Juliaのこれまでとこれから
JuliaTokyo #1
RとJulia
TokyoR #39 LT
CW, AROW, and SCW
Synergies between Word Representation Learning and Dependency Parsing
Sorami Hisamoto (Master's Thesis)
2013
Babel Guide: 5 Languages in 13 Weeks
Parsing The Web with Deep Learning: A Shallow Introduction
Rakuten Institute of Technology, New York
Few Things on Scala: いらちのためのScala入門
Construction of English MWE Dictionary and its Application to POS Tagging
Yutaro Shigeto, Ai Azuma, Sorami Hisamoto, Shuhei Kondo, Tomoya Kouse, Keisuke Sakaguchi, Akifumi Yoshimoto, Frances Yung and Yuji Matsumoto. (NAACL2013 MWE Workshop)
Perceptron, Support Vector Machine, and Passive Aggressive Algorithm.
An Empirical Investigation of Word Representations for Parsing the Web
Sorami Hisamoto, Kevin Duh, and Yuji Matsumoto. (言語処理学会第19回年次大会)