ボイコネ2いきたい
ボイコネ2いきたい https://twitter.com/voiceconnect_ad
ボイコネ2いきたい https://twitter.com/voiceconnect_ad
VOICEVOX VOICEVOX 0.9.1がリリースされ、つむぎちゃん、リツさんが実装された。 まだ使いこなせていないけれど、つむぎちゃんは、はっきりしたいい声で話してくれる。 リツさんもクールな声で話してくれる。 しかし、WebページとLinux版では、つむぎちゃんの画像がぼやけていた…。 このままでは、わたしの中のイメージが、ぼやけつむぎちゃんになってしまう。 ソフトウェア側の立ち絵がぼやけていなかったのが救いだが。 どうにも、奇数幅の画像を表示しようとするときに起きる問題らしい(Chromeか、画像を扱うライブラリか、グラフィックスドライバか)。 圧縮効率がよくなるといいなと思って、自分の作る画像ではだいたい偶数幅にするようにしていたけれど、謎の問題が起きることがあるのか…。 画像フォーマットの仕様上は奇数幅画像を扱えるのに、なんか残念な感じがある。 Windows版のChromeはなにか対策が組み込まれているのか、はたまた偶然か、再現しなかった。 Electronの方(VOICEVOXソフトウェア)では再現したので、Chromiumが抱える問題かもしれない(Chromeではなんやかんや修正されているとかあるかもしれない)。 https://github.com/Hiroshiba/voicevox_resource/pull/1 https://github.com/Hiroshiba/voicevox_blog/pull/6 修正のため、それぞれPRを用意したけれど、Webページの方は自動縮小版画像が絡んで少しややこしそう。 あと、再現性がよくわからない、おま環対策PRなのも不安要素(ヒホさんの環境では再現しないっぽい)。 一回Issueを作ってからでもよかったけれど、修正策は一応分かっているので…。 もっといい方法があるかもしれないというのは気になるが。 おためし ぼやけつっむです.mp3 VOICEVOX:春日部つむぎ, ぼやけつっむです.vvproj(VOICEVOX 0.9.1) なんか0.9.1時点ではちょっと音割れ気味な感じがあるので、音量を控えめにした方がいいかもしれない(0.50くらい?)。 誰にでも様付けするデルシェア姫(胃世界料理道)のイメージを反映してみたい(ボイロ同士の掛け合い)。 卑屈というわけではなく、活発な女の子だけれど、相手に失礼にならないようにと気をつけるあまり、敬語が抜けない感じ。 デルシェア姫は高貴な生まれだけれど粗野な平民と頻繁に触れ合う機会があったという特殊な経緯があるので、 卑屈に見えないようにするには、そういった背景が必要かもしれない。 いま商用ソフトで持っているのはA.I. VOICEの琴葉姉妹だけなので、VOICEVOXのキャラと合わせて読み上げさせてみる。 茜さま 茜さま.mp3 葵さま 葵さま.mp3 めたんさま めたんさま.mp3 ずんだもんさま ずんだもんさま.mp3 VOICEVOX:春日部つむぎ, 春日部つむぎ_キャラさま呼び.vvproj(VOICEVOX 0.9.1) 声が元気なので、こういうキャラクター性を演じられる感を得ている(公式設定とは無関係に)。 わああ、めたんさま、それはいかなる御技なのでしょう! わああ、めたんさま、それはいかなる御技なのでしょう.mp3 VOICEVOX:春日部つむぎ, 春日部つむぎ_わああ、めたんさま、それはいかなる御技なのでしょう.vvproj(VOICEVOX 0.9.1) ふふん、つむぎは知っているかしら.mp3 VOICEVOX:四国めたん, 四国めたん_ふふん、つむぎは知っているかしら.vvproj(VOICEVOX 0.9.1) ベアトリス(Re:ゼロから始める異世界生活)のアニメCVを聞いたことがないので、これに近いイメージを持っている。 特に意味はないのよ? ほんとよ?.mp3 VOICEVOX:四国めたん, 四国めたん_特に意味はないのよ? ほんとよ?.vvproj(VOICEVOX 0.9.1) 波音リツはクールな声ゆえに使いどころが難しいかも。 [使いどころさん!? まずいですよ!.mp3](assets/波音リツ_使いどころさん!? まずいですよ!.mp3) VOICEVOX:波音リツ, [波音リツ_使いどころさん!? まずいですよ!.vvproj](assets/波音リツ_使いどころさん!? まずいですよ!.vvproj)(VOICEVOX 0.9.1) 電車の例はよかった。落ち着いた声? 次は、明大前、明大前.mp3 VOICEVOX:波音リツ, 波音リツ_次は、明大前、明大前.vvproj(VOICEVOX 0.9.1) ...
VOICEVOXのコア、Raspberry Pi版のプルリクエストがマージされた。うれしい。 ツムギチャンカワイイヤッター! 来週には新キャラクター追加のβリリースがされそう。開発者向けの公開だけかもしれないけど、どうなんだろう。 Webサイト(ボイボ寮)を作って、動画を作って、と告知の準備を進めている段階。 前回のスタイルアップデートで動画作成をスキップしたので、今度は作るということなのだろうけれど、 間に合うのか(大変そう)。 ブログの方は、Hexoのnoindexと相性がよくない気がしている。 テーマがHTMLのすべてを決めていると思うので、テーマ次第になってしまうのだけれど、 カスタム面倒くさいし、デフォルトで提供されていないってことは想定している使い方ではないってことなんだよなぁ。 それはそう、ふつうはSEOを意識して検索インデックスの上の方に出てきてほしいよね。 ページランクを意図的に下げるみたいなフラグがほしい(noindexでいい)。 個々のページにURLを発行しないみたいなのもできる気がするけど、作るの面倒くさい。 PBL講義の一環として、Androidアプリを作る計画がある。 Kamishibai(仮名):https://github.com/aoirint/Kamishibai イメージとしては、スライドショー付き音楽プレイヤーで、複雑なシステムではない。 Spotifyのキャンバスが近いかもしれない。 ベースのアイデアは、過去にプロトタイプレベルのAndroidアプリとして途中まで作っていて、 GitHub上にあるCampMusicPlayerとMadPlayerDroidがそれにあたる。 これをきちんと完成させたい、というものになる。 開発としては、流行りの? Jetpack Compose / Kotlinを使うつもり。 ReactかNext.jsかElectronかで書こうとしたリポジトリもあった気がするけど、 Android組み込みのメディア機能を使いたい感じがしていて、相性がよくわからない。 Hexoのテーマをforkして、noindexとno-referrerを挿し込んでみた。 なんか二重にnoindexが定義されちゃうけど、仕方ない。 特定のカテゴリにnoindexと、ブログトップからの除去を実装したいけど、面倒くさい。 それができたら技術ブログと統合してもいいか…? どうなんだろう
Twitterは開かれすぎていて恥ずかしいし、下手な投稿をすると、エゴサする人とか、有識者とかを変に刺激して、攻撃的な反応をされることがある場所になっている。 それはとても疲れるので、そういう攻撃にさらされにくく、個人的な文章を公開できる場所がほしかった。 自分の考えを整理する機会がないので、半分自虐のお気持ち表明みたいなこともやるかもしれない。 そういう意味で、自分への免罪符と、覗きに来る人への立て札として、サイト名をVent・排気口としている(あもあすの影響)。 こういった自分の思っていることを書く文章というのは、大抵の場合、恥ずかしくなったり、書くことがなかったりで、1つ2つ書いた時点で消したり、使わなくなってしまったりする。 過去の記事タイトルや概要が一覧表示されると、恥ずかしくて消したくなってしまう。 そのあたりを考えると、細かいことを気にせずに書ける方法がいい。 はてなブログは、UIは使いやすくて好きなのけれど、PRO版でないと、はてなキーワード機能で有識者を引き寄せてしまうのが怖い。SNS化されていない場所がいい。 それならWordPressか、と思って一度VPSに立ててみたけれど、Markdownで書けない(プラグインのことは考えたくない)のがつらい。Markdownといっても、ソフトブレークなちゃんぽんだけど。 DokuWikiとかMediaWikiが向いているとは思わない。Sphinxもカテゴリ/タグ機能がない感じが微妙。 DBが必要というのはイケていない。 ならGit管理だ、GitHubだ、SSGだ、となる。 それで、なんかモダンなTypeScriptで書かれたHexoを試しに使ってみた、ということになる。 ふだんはPythonで書かれたMiyadaikuを使っているのだけれど、ユーザが少ないので、あまりいいテーマがない。 となると自作することになるのだけれど、2,3記事で爆破するかもしれないものにそこまでの労力をかけたくない。 といっても、いまこのブログもデフォルトテーマのLandscapeを使っていて、その理由はあまりいいテーマがなかったからなのだけれども。Lightはよかったけどコメント欄が消せねえ。 Git管理結構、GitHub結構、SSG結構なのだけれども、_postsディレクトリに過去の記事が全部出てくるのがイケてない。slugという仕組みとマッチしていない(なんでURLに2回日付が出てくるんですかね)。記事を作るときに記事の名前が必要なのもイケてない。 画像を追加したら、音声を追加したら、どんどんリポジトリが重くなる。まあフルクローンする機会もそうそうないか。世の中のサービスはすぐにサ終するので、外部にアップロードはしたくない。 ほかにもURLの永続性とか、いろいろ考え始めるとキリがないので、そのあたりの運用は適当になることをご承知おきいただきたい。 あまり納得のいっていないHexoから乗り換えるときにURLをリダイレクトさせるとか面倒くさいので。 あとなんか記事ジェネレータがバグっていて、生成されたmdファイルがそのままだとビルドできない(なぜか{}がfront-matterに入り込んでいて、タイトルもUTC時刻になっている) うーん、万が一この記事が攻撃の対象になったときに、言及している対象に迷惑がかからないように、とか余計なことを考えてしまう。 それだったら記事を分割して、余計な言及をあいまいにして…としたりしなかったり(戻したり)しながら書いている。とても無駄だし、とてもストレスになる。 はてなキーワードはこの意味でよくない。 記事を分割すると書くまでもない、みたいなことが拾えずに気になってしまう。 リンクを張るならnoreferrerしないと、解析に残ってしまうな…。 https://github.com/hexojs/hexo-filter-nofollow これでよさそう。 悪意があるのかないのかわからないけど、攻撃的な反応と受け取ったことで、 精神ダメージを受けている人を同時に2人観測するのはあんまりよくない(ふにちかさんとヒホさん)。 そしてこういうのがエゴサにひっかかってしまうので、noindexせざるを得ない。
ずんだもんとかめたんちゃんを調声したやつをちょいちょい載せたりとかしてみたい(他の音声合成ソフトだと、素材の配布にあたる可能性があって、判断が難しい気がする。再利用目的じゃなければいいと思うけど)。 動画作るのは時間かかるから難しいけど、自分もVOICEVOXのユーザになりたい。 プラネタリウムはいかがでしょう。 どんな時も決して消えることのない、美しい無窮のきらめき……。 満天の星々がみなさまをお待ちしています(planetarian ~ちいさなほしのゆめ~) プラネタリウムはいかがでしょう.mp3 VOICEVOX:四国めたん, プラネタリウムはいかがでしょう.vvproj(VOICEVOX 0.8.0) さすラギっ(ふにんがす) さすラギっ.mp3 VOICEVOX:四国めたん, さすラギっ.vvproj(VOICEVOX 0.7.5) (如月ラギさんに対して、さすがです、の意味。言葉自体はおそらくコメント由来、再現というわけではないが、音声化はじょかあきさんの動画由来?)
15日にVOICEVOXへのプルリクエストを出した。 https://github.com/Hiroshiba/voicevox_core/pull/41 ONNX版がリリースされてからになるが、 Raspberry Pi環境で製品版VOICEVOX COREが動くようになるといい。 ONNX版への移行はいつ頃になるだろうか。 現状で動作に問題はないので、優先度はあまり高くない感じだと思う。 追加キャラクター3人を予定していて、いまはHPの改修に力を入れているようなので、 それらが終わったら手を付けられるだろうか(つむぎちゃんかわいい)。 VOICEVOXフロントエンドを動かすことは自分は考えていない。 なんか大変そう(Electronをarmhf向けにビルドするのが)なわりに、合成に時間がかかって使いにくいと思う。 コアがRasPiで動くのがおまけなら、おまけのおまけくらい。 動画編集するならamd64+NVIDIA GPUのこなれた環境でいいんじゃないかな。 コアさえ提供されていれば、動かすことは不可能ではないし、ほしければ/いい活用のアイデアがあればPRしてほしい。 ENGINEはHTTP APIがついて便利なので、あった方がいいと思う(Dockerで使いやすくなるし)。 二度手間になるので、暗号化周りが裏で実装されて、製品版ONNXコアのリリースが出てからENGINE進めるでいいかなと思っている。 まあそのうち使えるようになっていたらうれしい。 それまでは、Hacobuneとかを使うといいと思う(β版で無料)。 ライト版か外部デバイス版で推論高速化が実現しない限り、RasPi上での音声合成にはそれなりに時間がかかるので、Raspberry Pi版が出たとしても、外部のHTTP APIを使うのは有力な選択肢だと思う。
https://zukisuzukibgm.com/ たいたぬさんの配信で聞いた。 1000曲近い、いい感じの音楽が無料で、ゆるい利用規約で公開されている。すごい。 Cash Back: https://www.youtube.com/watch?v=yj_RT7epy_M 今日の記事はこれを聞きながら書いている。 これをするときはこの音楽を聞こう、みたいなこともできるかもしれない。
メモ書きにはSimplenoteとJoplin、Atomを主に使っています。 WYSIWYGの選択肢もありますが、基本的にはMarkdownが好きです。 Sphinxを使う関係でreStructuredTextを書いたりもしましたが、Markdownの方がずっと書いているので慣れています。 しかしMarkdownは方言が多く、込み入った機能を使おうとすると安定しないのが難点です。 ここに記事を書くにあたって脚注を使ってみようとしたのですが、 Simplenoteでは表示できず、 AtomのMarkdown Preview Plusでは手動で機能を有効化する必要があるようです。 Joplinもデフォルト有効のオプションみたいでしたが、ツールによって安定しないのは使いづらいです。 https://atom.io/packages/markdown-preview-plus SimplenoteはAndroid、iOS、Linux、MacOS、Windowsすべてから、ブラウザと認証情報さえあればすぐにアクセスできて、モバイルアプリもあるのが強みなように思います。 また、テキストオンリーということで動作の高速化を図っているらしいです。 ただし、Simplenoteに大量のメモを保存したことはない(200件程度)ので実際に大量に保存した場合(1000件以上)の動作は不明です。 Simplenoteは、必要なときにメモをとって、必要なくなったら削除する or 念のために残しておく、くらいの使い方が向いている気がします。 https://app.simplenote.com/ Joplinは、EvernoteライクなOSSです。 メモファイルはDropbox、OneDrive、S3ほかを使って同期できます。 テキストオンリーならばそれほど容量を消費しないという仮定に立てば、Dropboxライトユーザーなわたしには同期先としてDropboxがいい気がしています。 同期時は差分データをすべてダウンロードしてくるため、同期に時間がかかるのが難点です。 また、プロキシ非対応なのが不便です。 透過プロキシを使うことで強制的にHTTPプロキシを通過させることはできますが、便利とはいいがたいです。 https://github.com/laurent22/joplin/issues/164 https://github.com/wadahiro/go-transproxy Atomはメインのテキストエディタですが、Electronベースなので若干起動が遅いです。 コードやドキュメントを書くのに使い慣れているので、メモ書きにも使います。 ファイルの保存先選定に困るので、たいてい保存するときは他のアプリに移動しますが.. Notionも少し使いましたが、前記事の理由で使い続けるのはむずかしいです。 Confluenceは使い方がわかっていません(個人で使うには機能が多すぎるかも)。 Growiはそれなりによさそうなのですが、非公開利用には自前でホストする必要があったり、RAM消費が大きかったり、UI的に使い込めていない部分があります。 esa.ioは気になっていますが、Crowi/Growiベースに見えるので日常メモに向いているか不安があります。
文章1つ書くのにも余計なことを考えるようになってしまいました。 ツールを乗り換えつつ文章を書いていますが、(ツールとして)一番長く続いているのは Twitterなのかもしれません(アカウントは連続していないが、2013年にはアカウントがあったらしい)。 初期のTwitterアカウントやブログはarchive.orgに残っていて、 人間関係もリプライを検索すれば出てきます。 運用は今とほとんど変わらない(技術についてつぶやいたり、フリーソフトを公開したり)ですが、ある種のデジタルタトゥーです。 晒し、クソリプ(ブコメ、引リツ)、デジタルタトゥーのようなものを踏まえると、 個人的な考えを文章化して発信することには結構(精神的な)リスクがあります。 もちろん、技術的に未熟のため見当違い・陳腐な感想を書いてしまうのがあまり好きではないというのもあります。 これも後で見返したときに精神的ダメージを受ける可能性があるためというのがあります(前記事参照)。 技術記事ではそれ自体の性質に加えてこのようなリスクを避けるため、可能な限り感想的なものを排除したいというふうに思っています。 新しい記事では時折考えのようなものを含めていることもありますが、挑戦的なものです。 技術記事の寿命は、需要はともあれ、10年以上前の古い技術ブログを参照するようなこともあるなど、結構長かったりするように思います。 技術記事では、記事の内容は生きているが、思想が更新されたという状況は避けたいです。 大抵の場合、記事は自分が見返すために書いているので、リスクが高いです。 しかしお固い企業アカウントのような体裁でいてもつまらないので、お試しでダイアリーを書いてみます。 気が向いたらaoirint.comのサブドメインに移すかもしれませんし、やめてしまうかもしれません。 媒体ですが、マイブームはGit+SSG(JAMStack)なのですが、謎のYAMLヘッダを付ける必要がある、投稿自体が面倒、微修正が手間など、いろいろと利便性に欠けるところがあるので、はてなに戻ってきてみました。 好きなことを好きに書きたいので、Twitterに近い使い方をする可能性もあります。
わたしは一度書いたメモのことはわすれたいです。 必要なときがきたら検索で探せばいいのですから。 しかし今のメモアプリはわすれることができません。 エディタを開くと、夢の記録から作品の感想、創作のメモ、書きたい記事、開発のメモ、研究のメモまで、色んなジャンルのノート(あるいはノートブックの名前)が一覧表示されてしまいます。わたしはこれが苦手です。 例えば、メモアプリを開くたびに、 支離滅裂な夢のストーリー、それに対する考えを見る(あるいは思い出す)ことになり、 初見ではおもしろいと思った作品の粗探しをすることになり、 解決済みでわすれるべき課題が幾度も目に入る(いつまでも残っている警告の貼り紙は不快)ことになり、 創作の設定や筋書きほか、Not Safe for Publicなメモ内容、また個人情報などをスクリーンショットや画面共有、覗き見で晒すリスクもあります。 業務ならば大抵の場合、作業目的(タスク)がはっきりしているので、必要な情報にすぐアクセスできた方がよいのですが、 日常的なメモの場合は、ノートブックやノートの一覧が表示されると、 このような形で心理的に不安全です(Not Safe for Home/Work/Cafe)。 P.S かなり個人的な会話を人に聞かれることに抵抗がない、というのを観測してもいます。 カフェで個人的な会話を大きな声でするのに近いです。 歳月を重ねることで恥が積み重なっていって、気にしなくなるときが来るのかな。 きっと10年前も同じことを言っていたと思うので、10年後も同じことを言っているのだろうと思うけれど..