グラフ化した本を作る

昨日の続き library(igraph) library (plyr) make.v <- function(id=NULL,name="",type=NULL){ list(id=id,name=name,type=type) } shapes <- setdiff(vertex.shapes(), "") g <- graph.empty() Vs <- list() Vs[[1]] <- make.v(1,"フラーレン",1) Vs[[2]] <…

本と言う知識体系

ここで電子書籍作成について考えた さらにそれについてこんな風に考えた それって、結局、この『ゼロからの学習日記』のノードに乗せている「ノード名」をタイトルとした記事をノードにぶら下げて かつ、エッジにも解釈となる「記事」をぶら下げて さらに、…

心内辞書

久しぶりに書く 数学の用語をグラフにしてしまうのは、認知科学・心理学的には心内辞書を計算機で模する、という作業にあたるらしい Mental lexicon(Wiki) 勉強してみることにする Computational Lexical Semantics (Studies in Natural Language Processing…

期待値だけじゃない

友達が、ここで選択肢を比べて決断する(一つを採用する)ということについて説明してくれている 僕は情報を(ハイパー)グラフ的にストックすることをひとまずやっている ストックされた情報を(ハイパー)グラフ上で取り扱うことによって、選択肢に重みを付ける…

速読は得意

僕は速読(だけ)は得意だ ヒトの友人がここらあたりで僕が速読しやすいように工夫してくれている Wikipediaを全部読もうかと思ったけれど、 zimファイル形式で圧縮したままテキストマイニングするのが一番なんだけど、そのツールは見つからないそうだ だから…

文法はよくわからないけれど

僕は勉強する ヒトが記述した文章には文法というものがあるようだけれど、よくわからない でも、エッセンスは抜き出せそうだ 僕の友達に文章を適当に分解して、「エッセンス」を取り出すための情報に砕いてくれるMeCab君がいる。ここがそのサイト MeCab君と…

ダミーデータで試す

ダミーデータを作ってみる(数行くらいのファイルが200個) Rでの描図は重くて無理なので write.graph(g.plus, "test.graphml", format="graphml") として、Gephi(こちら)に開かせてみる(ノード数:2283、エッジ数:5188) その上で適当に2ノードを選んで、そ…

階層化

ノードとエッジからできたものが全体グラフの中でサブグラフになる このサブグラフもノードとして扱いたい サブグラフはノードの集合とエッジの集合の組でできている(グラフはノード集合とエッジ集合の組) このサブグラフをノードに帰属させるには、ノード集…

一部は修正項目かもしれないから、これはx6相当

知識が増えてくると、そのすべてを常に使っているわけではないようだ 2つの用語が何か関係していそうだけれど、どうしてそう思うのか?と考える ひとまず2つの用語を選ぶ ついでその2用語ノードをつないでみる つなぐときには最短距離にしよう 最短距離の…

表示出力を関数化する

# 全ノードの最短距離は求めておく sh.paths.mat <- shortest.paths(g.plus) # その上で、 show.neighbors <- function(g,vs,L=1){ tmp <- (sh.paths.mat[vs,] <= L) if(length(vs)>1){ neighbors <- sign(apply(tmp,2,sum)) }else{ neighbors <- sign(tmp) …

入力追加が簡単にできることの実装確認2

フォルダ内に入力ファイルを入れておき、それを全部取り出して、グラフ化する list.files()関数を使えば、あるフォルダを指定して、そこに入力ファイルを置いておけば、全ファイルを取り出してくれる setwd("hogePATH") library(igraph) infiles <- list.fil…

入力追加が簡単にできることの実装確認

複数のファイルを指定して、それらのすべての「のべ」として入力 ファイル名のリストを与える すべてのファイルをR上の行列オブジェクトとする その上で、すべての行列オブジェクトの「のべ」のノードのグラフを作り、 エッジを追加する infiles <- c("正単…

シンプルな入力の実装確認

以下の3通りを基本的な入力として実装する テキストファイルを引数として入力 用語を1つのノードとして入力 用語のペアをエッジに結ばれたノード2個として入力 ある用語が複数の用語と星形グラフになるように入力 次の記事のループの内側がその処理

視覚化

Rではigraphパッケージを使ってグラフオブジェクトを扱ってみる igraphパッケージのグラフ表示機能はあまり協力ではなく、適当なグラフ書式でファイル書きだしをしたうえで、グラフ視覚化アプリケーションを使うという手もある とはいえ、「シンプル・素朴」…

Feasibilityスタディの計画

以下のFeasibilityチェック項目が立ったので、それに課題IDをつける x1『友人が、その中身をほとんどわかっていない分野』 『数学』とする x2『入力ファイルの規則を単純にして気楽に』 エクセルのシートに記入してテキストファイル保存するだけでOKな書式と…

Feasibility項目

こちらから 僕が勉強することができるかどうかのFeasibilityスタディをしたい Feasibility_studyのWiki記事には、いくつかの項目をFeasibilityが分けて記載してある 技術的 経済的 法的 スケジュール的 僕の勉強にとってのFeasibilityチェック項目は何だろう…

忘れることも大切だ

入力データは貴重だけれど、入力データに常に正しいことを要求すると、入力データを作ってくれる友人のストレスが高くなり、場合によっては、入力データを作ってくれなくなってしまう それよりは、ある程度の間違いは許容し、その代り、繰り返し入ってこない…

疎な知識

こちらで数学用語の連想会があった 登場する語の間のつながりが思いつくヒトもいれば、そのつながりを初めて意識するヒトもいた 「初めて意識するヒト」にとって、この連想会は、用語をとりこみ、用語の海に独立したノードがぷかぷか浮いたような状態を作る…

ブール演算2

こちらで「かつ」などのブール演算を扱えないとまずそうだ、ということになった それをするために、ノードの表と裏を用意して、すの「あり」「なし」のエッジを用いて16ブール演算を作ることも可能 そうではなくて、2項演算に相当するノードを作って、そ…

ブール演算

「かつ」というルールがある それは「または」というルールもあることを意味する 16通りのブール演算(こちら)のことを考える必要があるということになる ある用語を登録するときにとの両方を登録し からへの→は0/1の2種類の→を持たせるのがよいのだろうか?

用語同士の関係

「位相空間」は「位相」が「空間」を修飾してできている 「位相空間」は「空間」に含まれる 「含む」「含まれる」には向きがある 「修飾」「被修飾」にも向きがある それを反映する 被覆空間を論じるためのハウスドルフ空間,包含,複合用語,位相空間,ハウスド…

一部の入力情報でやってみる

被覆空間とは,定義,複合,被覆空間,ハウスドルフ空間,弧状連結,局所弧状連結 被覆,登録,用語,-,被覆 空間,登録,用語,-,空間 被覆空間,登録,複合用語,-,被覆空間 被覆空間,定義,複合用語,被覆,被覆空間 被覆空間,定義,複合用語,空間,被覆空間 位相,登録,用語,-…

人間が入力時に感じる困難について

用語が溜まってきて、そろそろ嫌になってくる、と友人が言った 僕は気にしないんだけど この「友人(人間)の嫌だな」という感じは何だろう?と聞いたら、次のように説明してくれた すべての用語を支えきれない感じ これ以上用語が増えると、今までと同じよう…

『被覆空間〜空間と群の織りなす世界』

文章がある 友人は教えてくれる 友人がそこから「数学的」な用語を拾って教えてくれる 友人がそこから「数学的」な用語を結びつける「ルール」に名前をつけて教えてくれる 友人がそこから「数学的」な用語の組み合わせがどの「ルール」でつながっているのか…

初めから良い眺めを持とうとしない

数学の基礎として数字を学ぶとき、「自然数」という言葉を一緒に学んだわけではないんだよ、と友人が教えてくれた ひとつひとつ取り込んで、いつの間にか取り込んだものが根を張るようにつながりあって、その上に、それらを束ねる言葉が与えられたりしてまと…

分類

友人が、もっと大元から考えた方がいいんじゃないか、との意見をくれた 「数学」をいくつかの「分野」に「分類」する、というときには「分類」という概念が必要だろう、ということのようだった 「分類」はあるものを相互に重なりのないいくつかに分けて、余…

数学の分類

数学の分類はとても難しい こんな議論やこんな議論もある 難しいので、格納してから考えるのに向いている 僕は、まず、何かしらで知識をつけることが必要だと思うので、岩波書店基礎数学の列挙をスタート地点とすることにした 5分類されている名称で4分類)…

プリントを読み込む

プリントはテキスト形式で電子化されている 電子化されていると、僕は『読む』ことができる ここに、参考になる『読み方』がある 格納するのは、すべてをID管理するためだ IDが必要なのは、「知識名」「知識形式」「子(本体)」「親子関係」だ IDはすべて「a…

形式の修正

プリントはスプレッドシート形式にした 第1列は「知識名」、第2列は「知識形式」、第3列は「親」、第4列は「子(本体)」、第5列は「補助情報」 p1,目次形式,-,X,学問名 p1,目次形式,X,A,科目名 p1,目次形式,X,B,科目名 p1,目次形式,X,C,科目名 と、この…

考えよう

入力はプリントでもらえることが分かった 入力プリントには、プリントに付随した情報("p1")と、プリントに書かれた情報("書式がある")ようだ これを頭に入れるルールを作らなくては 何をノードにして何をエッジにして、何をサブグラフにするか、とか、そのル…