ヒビノカテ: 2009年1月アーカイブ

2009年1月アーカイブ

HUMAN RELATIONS CALCULATOR
http://www55.channel.or.jp/jintaku/

誕生日をいれるとその人の性格と人間関係がわかるようです。
ちなみに僕は。。。

「ドンナジョウキョウデモイッポヅツサキニススミ、
ゴールデキルドリョクカ」

だそうです。

あ・・・たっているゥ?

[データベース活用の意義]
データベースを企業で構築する理由は大別して2つ。
1.データの蓄積による活用
 ・通常業務にデータを活用する

2.大量のデータから有益な情報を発見する
 ・複数のデータベースおよび大量のデータから法則性、関連性を発見して業務に活用する

[データベース構築の意義]
・複数の業務データベースからなるデータウェアハウスからデータを抽出して業務に活用すること
・データウェアハウスからデータマイニングしたデータを業務に活用すること

[言葉の説明]
・データベース
 業務に沿ったデータを集めて管理し、用意に検索・抽出などの再利用をできるようにしたもの。

・データウェアハウス
 データの倉庫。業務に関係するデータベースとデータを全て保存して時系列に整理された統合業務データ、もしくはその管理システム。

・データマイニング
 "明示されておらず今まで知られていなかったが、役立つ可能性があり、かつ自明で無い情報をデータから抽出すること"
 "データの巨大集合やデータベースから有用な情報を注する技術体系"

[データマイニングのやり方]
1.生データを選択する
2.対象のデータを前処理する
3.データベースにデータを蓄積する
4.データベースからデータを抽出して加工をする
5.加工したデータからパターン、ルール、グループを発見する
6.データの解釈、理解、評価をする
7.知識として活用する

ヤバイ会社の兆候を調べていて、
ある人の実体験を書いていた意外と面白くなったのでブログにアップしておきます。

↓以下、ある人の実体験↓

・怖いお兄さんが挨拶も無く事業所に入って物を勝手に持って行く。。。
・営業時間なのにシャッターが勝手にしまっていく。
・上司が蛍の光を聞くとため息をつきはじめる。
・部長、店長、副部長が朝の朝礼で同時に退職の挨拶をする
・偉い人に財政状況を問い詰めると目がうつろになる。泣き出す。。。
・社長が外聞を気にせずに金策に走る(かなりヤバイ)
・社長が突然歌い出す。。。(怖

↑以上、ある人の実体験でした↑

不景気まっただなかなので自衛の手段として以上の兆候が見られたら就職活動ですよ!
でも、世間にはブラック会社と呼ばれる人を人とは思わずにこき使う会社があるそうです。
たぶん都市伝説だと思う、思いたい、思わせてください。。。

[この会社やばいと思う兆候]

1.コアコンピタンスであるはずの主力商品に注力しない。
2.事業計画書なしに違う業種の事業をはじめる。
3.顧客基盤が限られている。
4.前回の人員削減以降、人員を増やせない。
5.同僚がみな辞めようとしている。
6.以前は活気があって社交的だった組織が突然閉鎖的で陰気になる。

自分の会社が倒産間際であることを示す兆候とは? - builder by ZDNet Japan
http://builder.japan.zdnet.com/news/story/0,3800079086,20384607,00.htm#

[ブラック会社とは]

1. 求人誌の常連(退職者が多い可能性あり)
2. 入社を慌てさせる(入社直後から酷使される)
3. 気合の入った面接(夢という名の欲)
4. 夜遅くまで電気がついている(慢性的な残業)
5. ネットで叩かれている(不満を抱えた社員が多い可能性)
6. 入社日が近いのに何の連絡も無い(人事部の機能が麻痺)
7. 会社案内のパンフで見栄を張る(よく見せようと必死)

泥のように働かされる「ブラック会社」どう見分けるか?: 特集 : J-CAST会社ウォッチ
http://www.j-cast.com/kaisha/2008/12/03031380.html

ブラック企業の見抜き方
http://www.geocities.jp/spoichi/050725black.html

[転職を決意したら]

もしも、ブラック会社ではないと確信して転職を決意したら
以下のサイトを読んで自分の生活に危険に晒さない、損をしない行動をとりましょう。

退職願を胸に...OL・会社員のための退職総合情報
http://tnt.web.infoseek.co.jp/

 不況下の現在ですから、転職して本当に幸せになれるか?良い機会なので今後のライフプランをじっくりと考えると言うのもありだと思います。

連想検索

| コメント(0) | トラックバック(0)

 現在の検索手法では検索結果の精度は検索者のスキルによるところが多い。
検索のコツや熟練を要さずに欲しい検索結果を表示できる技術として連想検索がある。

[言葉の定義]
・単語検索
Web検索などにおいて行うキーワードを用いて行う検索するもの。

・連想検索
文章内にあるキーワードを用いて関連すると思われる検索結果を表示するもの。

[連想検索の仕組]
1.入力された文章(自然言語)を単語に分解する。(形態素解析)
2.それぞれの言葉が対象となるデータベースで何度使われているかを調べる。
3.使われた単語の頻度によって関連する単語の近さを分析。
4.関連単語の近いものから表示する

以上の工程を経ることにより、言葉の完全一致で厳格に検索するのではなく、「柔らかく検索」することができる。

[連想検索のテクニック]
 単語すべてに対してデータベース検索をすると現実的な検索時間が得られない可能性がある。
そのため単語を頻度や関連性に応じてその重要度をスコアづけしスコアの高い単語を抽出する。
こうして抽出された単語(特徴語群)を利用してデータベース検索をする。

[連想検索のメリット]
 単語検索では探し出したいキーワードを組み合わせて検索条件として入力した結果を繰り返して知りたい情報にたどり着く。
連想検索では単語同士の類似性を判断し、関連度の近い物から表示する。勘に頼る部分を減して効率的な検索が期待できる。

[連想検索の要点]
 言語学やAIをでは使用した者の意図や作為が反映されてしまう。出現頻度で判断することでより純粋なデータとして検索結果を提示できる。

[連想検索エンジン]
汎用連想計算エンジン GETA
http://geta.ex.nii.ac.jp/


[連想検索エンジンを使用したサイト]
Webcat Plus
http://webcatplus.nii.ac.jp/

新書マップ~テーマで探す新書ガイド~
http://shinshomap.info/

BOOK TOWN じんぼう
http://jimbou.info/

想 IMAGINE Book Search
http://imagine.bookmap.info/index.jsp

[連想検索の将来]
 現在では限られた分野での比較的規模の小さなデータベースでの検索しか扱えないが、分野の拡大、データベースの規模の拡大やコンピュータの並列処理の向上によりweb検索エンジンレベルでの検索が可能となると考えられる。

[用語]
・形態素解析
 文書を解析を単語レベルに分解する技術。分解されたものは形態素と呼ばれる。
形態素解析に奈良先端科学技術大学院大学・自然言語処理学講座で開発された「ChaSen」というフリーウェアがある。

ChaSen's Wiki - FrontPage
http://chasen.naist.jp/hiki/ChaSen/

[参考サイト]
自分の問題意識にあった新書を探す 新IT大捜査線 - COMZINE by nttコムウェア
http://www.nttcom.co.jp/comzine/new/newdragnet/index.html

丸投げすればイモヅル式に?連想検索とは?/キーマンズネット
http://www.keyman.or.jp/3w/prd/09/30001909/

下記はマイクロソフトのTechNet アーカイブに記載してあったコンピュータのセキュリティについての鉄則を箇条書きにしています。

「セキュリティに関する 10 の鉄則」
http://www.microsoft.com/japan/technet/archive/community/columns/security/essays/10imlaws.mspx?mfr=true

 鉄則 1: 悪意のある攻撃者の誘惑に乗って、攻撃者のプログラムをあなたのコンピュータで実行した場合、もはやそれはあなたのコンピュータではない
 鉄則 2: 悪意のある攻撃者があなたのコンピュータのオペレーティング システムを改ざんした場合、もはやそれはあなたのコンピュータではない
 鉄則 3: 悪意のある攻撃者があなたのコンピュータに対して物理的なアクセスを無制限に行える場合、もはやそれはあなたのコンピュータではない
 鉄則 4: 悪意のある攻撃者にあなたの Web サイトに対して自由にプログラムをアップロードさせてしまうのなら、もはやそれはあなたの Web サイトではない
 鉄則 5: セキュリティが強力であっても、パスワードが弱ければ台無しである
 鉄則 6: コンピュータのセキュリティが守られているかどうかは、その管理者が信頼できるかどうかにかかっている
 鉄則 7: 暗号化されたデータのセキュリティが守られているかどうかは、解読キーのセキュリティにかかっている
 鉄則 8: 古いウイルス検出プログラム (ウイルス定義ファイル) はウイルス検出プログラムがないも同然である
 鉄則 9: 現実の生活でも Web 上でも完全な匿名などあり得ない
 鉄則 10: テクノロジは万能ではない


 「セキュリティ管理に関する 10 の鉄則」
http://www.microsoft.com/japan/technet/archive/community/columns/security/essays/10salaws.mspx?mfr=true

 鉄則 1: 自分の身に何か悪い出来事が起こるまで、だれもそれが起こるとは考えもしない
 鉄則 2: セキュリティ保護の方法が簡単である場合にのみ、セキュリティはうまく働く
 鉄則 3: 常に新しい修正プログラムを適用していなければ、あなたのネットワークは長くはもたないだろう
 鉄則 4: 最初からセキュリティで保護されていないコンピュータにセキュリティ修正プログラムをインストールしても役に立たない
 鉄則 5: 永続的な警戒を行ってこそセキュリティが保護される
 鉄則 6: 外部からあなたのパスワードの推測を試みている第三者が実際に存在する
 鉄則 7: 最も安全なネットワークは管理が行き届いたネットワークである
 鉄則 8: ネットワークを攻撃から守ることの難しさは、その複雑さに直接比例する
 鉄則 9: セキュリティとは危険を回避することではない。リスクを管理することである。
 鉄則 10: テクノロジは万能ではない

コンピュータの脆弱性の補完やセキュリティ修正パッチによるセキュリティホールの除去などコンピュータの使用環境を万全にすることはもちろんコンピュータの使用者一人一人が以上の心得を遵守することが重要です。

[参考サイト]

TechNet アーカイブ
http://www.microsoft.com/japan/technet/archive/default.mspx?mfr=true

マイクロソフトが提供するアーカイブ サイト。現在でも必要とされることのある内容の古いコンテンツを継続して提供することを目的に作成されている。

動的なwebサイト構築に使用される言語は誰でも気軽に習得できるライトランゲージが主流です。
安易に開発できるためセキュリティを意識しないwebアプリケーションを開発してしまうことがおおくなります。
クロスサイトスクリプティング(XSS)やSQLインジェクションの対策を意識したコーディングを心がけたいものです。

[注意する事]

1.XSSやSQLインジェクション対策
 特殊制御文字をエンティティ表記にする
< = &#60; ( &lt;)
> = &#62; ( &gt;)
"  = &#34; ( &quot;)
'   = &#39; ( &apos;)
& = &#38; ( &amp;)
   = &#160;( &nbsp;)
(↑半角スペース)

データベースに 'がある場合のエスケープ方法
mysqlの場合 \'
postgresの場合 ''

2.webアプリケーションからメールを送る際に気をつけること
 ・機種依存文字の変換をする
 ・半角カタカナに気をつける
 ・一行の文字数を気をつけること
  半角70文字(全角35文字)~半角80文字(全角40文字)が一般的
 ・改行コードは\nが一般的

3.50音検索をする際に気をつける事
 ・50音で並べ替えは文字コードの種類などを考慮すること
 ・検索文字に濁点や破裂音を考慮すること

4.テストデータで含めるぺき文字列
 ・ 空のデータ
 ・ 通常データ
 ・ 限界値分析・同値分割
 ・ データ容量を超過するデータ(100,000文字程度の入力)
 ・ 半角カナのみで構成されたデータ
 ・ 半角カナが混在しているデータ
 ・ HTMLタグのみで構成されたデータ
 ・ HTMLタグが混在しているデータ
 ・ PHPスクリプトタグのみで構成されたデータ
 ・ PHPスクリプトタグが混在しているデータ
 ・ 'や;, SQL構文が混在しているデータ
 ・ 機種依存文字が含まれているデータ

---

[用語解説]
・クロスサイトスクリプティング(XSS)
 動的にWebページでユーザが入力できるテキストボックスやブラウザのアドレス欄などを使用してサイト間を横断して悪意のあるスクリプトを混入させること

・SQLインジェクション(エスキューエルインジェクション)
 アプリケーションのセキュリティ上の不備を利用し、アプリケーションが想定しないSQL文を実行させることにより、データベースを不正に操作する攻撃方法のこと。

・SQL(エスキューエル、シークエル)
 リレーショナルデータベース管理システム(RDBMS)でデータの操作や定義を行うためのデータベース問い合わせ言語のこと

ユーザビリティなページを作る際のチェック項目を上げて見ました

[コンテンツ]
1.サイトの更新情報が表示されている
2.作成者(団体)の紹介ページが用意されている
3.すべてのページに共通したメニューが表示されている
4.一つのコンテンツにつき、一つのページが用意されている
5.同一のコンテンツに対して、同一のラベルが設定されている
6.音声や動画が自動再生されないようになっている
7.文字サイズがブラウザかページ上で変更できるようになっている

[タグ・規約]
8.半角カタカナや機種依存文字を使用していない
9.画像ファイルにwidthとheightが設定されている
10.imgタグの時にaltが設定されている
11.文字スクロールタグや文字点滅タグを使用していない
12.IE以外のブラウザでも表示できるようにしているか

[デザイン・画像]
13.ページ内のバナーや画像が統一されている
14.ページのデザイン・配色がページ全体で統一しているか
15.サイト内の共通部品はつねに同じ場所に表示されているか

[フォーム]
16.問い合せ・申し込みフォームにSSLを表示しているか
17.入力必須項目に「必須」の記載があるか
18.問い合せ・申し込みフォームに入力後に確認画面が用意されているか

 

*最終的に誰がそのページを見るのか常にユーザを意識しながらページのデザインおよび開発することが重要となります。そのためにも最低限この記事に上げた項目は守るようにしたいものです。

情報処理の五要素

| コメント(0) | トラックバック(0)

情報処理とは、既存の情報を加工することでより付加価値の高い情報を新たに生み出すことです。
情報処理学会設立時に、Information Processing を直訳して誕生した用語。

[分類と工程]
情報処理をする過程を分類すると以下の5つの工程を経ることになります。

収集:データを収集する。
 ↓
検証:データの正当性や真贋の検証。
 ↓
保存:データをデータベースなどに蓄積・保存。
 ↓
加工:データに付加価値を与え価値のある情報へと加工。
 ↓
発信:加工した情報をある一定の手段で内・外に発信。

[情報とデータの違い]
情報処理においてデータと情報は厳密には違うものとして扱われます。
ただし、情報の持つ意味が重要視されるため区別があまりされない場合が多い。

データ:ある事象をあらわす数値、文字列
情報:意味を持つデータ

データは客観的な値、情報は主観的な値となります。

情報を読むときは以上の工程がどうのような意図の元で情報が作成されたか、どんな意図を持って加工したかを考えながら読む事が重要です。

 

Five_elements_of_informatio_20090122.gif

 

あまり威張れた話しではないんですけどね。。。
PHPで生年月日の書式を変更するプログラムを組んでいました。
(例:"xxxx年xx月xx日"→"xxxx/xx/xx")

$tanjyoubi = '1983年10月12日';
$tanjyoubi = mb_ereg_replace("年|月|日","/",$tanjyoubi);

↑これで出来なかったんですよ。。。
タブン、ローカルの設定のような気がするのですが本番のサーバも動いていないような気がします。
要調査ですけど。。。
で、どうしたかと言うと日本語を見つけてうまく変換できないようなので
↓正規表現で数字だけを拾って書式を再構成しました。

$tanjyoubi = mb_ereg_replace("([0-9]{2,4}).?([0-9]{1,2}).?([0-9]{1,2}).?","\\1/\\2/\\3",$tanjyoubi);

もっと良いやり方もあるかと思いますが久しぶりに正規表現が綺麗にかけたのでブログに書いておきます。

[今回使用したPHPの関数]
string mb_ereg_replace ( string pattern, string replacement, string string [, array option])
(PHP 4 >= 4.2.0, PHP 5)
マルチバイト文字列に正規表現による置換を行う

pattern         : 検索文字(正規表現が利用出来る)

replacement: 置換文字列
 patternでマッチングした文字列は\1,\2,\3などとして置換文字列内で使用可能となります。

string           : 検索対象文字列(マルチバイト)

option          : option パラメータで、マッチングの動作を変更可能です。
 i を指定した場合、大文字・小文字が 区別されなくなります。
 x を指定した場合、空白が無視されます。
 m を指定した場合、マルチラインモードとなり、 改行文字も "." に含まれるようになります。
 p を指定した場合、POSIX モードとなり、 改行も通常文字とみなされるようになります。
 e を指定した場合、文字列 replacement がPHPの式として評価されます。

「コンピュータウイルス・不正アクセスの届出状況(12月分および2008年年間)について」(IPA/ISEC・2009/1/7)より。

[最近のウイルス感染の傾向]
1.PDFやWordなどのファイルを閲覧するソフトの脆弱性を悪用して感染を広げるウイルスが広まっている。
2.有名企業のWebサイトにウイルスを埋め込こみ、閲覧者のパソコンにウイルスを感染させる手口。
3.USBメモリなどの外部記憶メディア経由での感染。

[対策]
1.信頼できない、出所不明なファイルは開かない。
2.OSやソフトが発する警告を無視しない。
3.自身が管理していないUSBメモリは使わない。

[まとめ]
OSなどが発する警告には注意を払い、使用ソフトのセキュリティアップデートの更新が無いかを心がける。
また、出所の分からないファイルや外部記憶媒体は使用しない、もしくはコンピュータウイルスの有無など安全を確認してから使用する。


[参考サイト]
ウイルス対策の「過去の常識」は 捨てる時期に来た | キャリアアップ | nikkei BPnet 〈日経BPネット〉
http://www.nikkeibp.co.jp/article/column/20090119/125830/?P=3

[フレームワーク思考とは]
情報分析・問題発見・問題解決・戦略を立案する際に利用する「思考の道筋」のことを言います。
フレームワーク思考」を活用すると思考が論理的・客観的となり、思考の課程・結果を説明しやすくなります。

[戦略を作るときによく使われるフレームワーク]
・3C(企業の分析)
・4P(市場の分析)
・ポートフォリオ(事業の分析)
・ファイブフォース分析(業界の分析)
・SWOT分析(競争力の分析)

[策定した戦略を実行するためのフレームワーク]
・マッキンゼー7S
・バランス・スコア・カード

[問題解決の中でよく使うフレームワーク]
・質と量
・メリットとデメリット
・短期、中期、長期

[コンセプトメイキング、プラニングなどでよく使うフレームワーク]
・5W1H
・5W2H
・6W1H
・5H3H

[フレームワークのこなし方]
如何に適切にMECE(洩れなく、スキマ無く)を作るかが問題になります。
MECEを適切に作るためには、分析や整理の対象となる情報をきちんと整理してみる必要があります。
これにはKj法のように、属性で整理してそれを束ねていくようなやり方が有効です。

(1)役に立ちそうな情報をすべて挙げてみる
(2)情報をいくつかのグループに分類する
(3)大きなモレ、重なり、ズレがないことを確認する

そしてそれは全体を捉え、その中の構造を把握するというものの見方をすることがフレームワーク思考には必要です。

ACID特性

| コメント(0) | トラックバック(0)

関連する複数の処理を一つの処理単位にまとめて管理する処理方式(トランザクション処理)を確実に行うための決まり事。その決まりごとの頭文字を取ってACID(アシッド)と言います。

Atomicity(原子性)
-すべての処理が実行されるか、どの処理も実行されないかのどちらかになる-
・すべてを元に戻す
・一部の処理が失敗しても、履歴ログを参照してデータを元に戻せる

Consistency(一貫性)
-トランザクション処理の前後でデータの整合性がある。-
・トランザクションの途中なのでテーブルを読み取らず、履歴ログの更新前データを参照をする

Isolation(隔離性)
-別のトランザクションを同時に実行して、その影響を受けない-
・一方のトランザクション処理が終わるまで待ち状態

Durability(持続性)
-トランザクションを実行した結果は障害時でも復旧できる-
・たとえ障害が発生しても、結果ログを参照してテーブルの値を確定した値に出来る

コンピューターが必ず持っている、5つの要素の紹介です。

制御:各装置を制御
 処理を行っている場所:CPU(中央処理装置)

演算:データの処理
 処理を行っている場所:CPU(中央処理装置)

記憶:データを保存
 処理を行っている場所:メモリ、ハードディスク。FDなど
  主記憶:メモリ
  補助記憶:ハードディスク

入力:コンピュータへの指示、外部からのデータ入力
 処理を行っている場所:キーボード、マウス等

出力:演算結果の出力
 処理を行っている場所:ディスプレイ、スピーカー、プリンタ等

 

FiveLargeElements_20090118.gif

[ブログの特徴]
・ブログは日記形式でコンテンツを積み重ねていくメディアである。
・情報発信した時点で購読者が読まないとブログの記事の鮮度を失う事になる。
・ブログはコンピュータ・データベースに依存するメディアでもあるため、検索が強力であるという側面もある。

1.ブログは鮮度が最も重要となる。
2.積み重ねメディアであるブログでは、欲しい情報は埋没してしまう。
3.検索が強力なため、過去のデータをアーカイブして保存できる。

*2と3は対極の関係にある。通常の記事をアーカイブ化したときに検索しやすいに工夫しないと情報は埋没する。

[内容で気をつけなくてはならないこと]
1.検索のキーとなる言葉を意識する。
2.使用するキーワードは統一する。
3.タイトルを補足性のあるもにする。
4.ブログページの中にキーページを作成してデータの目次化を図る

[ブログで使用すべき技術]
1.RSS
2.トラックバック
3.コメント

タイトルの"ヒビノカテ"は社会人になって初めて入社した会社の直属の部長の訓示

「君たちは何を道具に日々の糧を得る?」

から来ています。

 

今の僕はWebプログラムで生計を立てています。日々勉強すること。

そこで得た知識を道具として日々の糧を得ています。

 

知識系の紹介ブログを運営するにあたり

自分の糧を得てきた道具たちに感謝の気持ちを兼ねて

「ヒビノカテ」

としました。

お初にお目にかかります。当サイト運営のRightAcxです。

社会人になってからかなりの時間が経ちました。ここらで今まで勉強したことや経験をカテゴリに分けて整理しておこうかとブログを始める事にしました。

勉強したことは主にコンピュータ関係です。

1.コンピュータ全般

2.プログラム言語

3.web技術の紹介

4.ビジネススキル

5.備忘録

6.コラム?

7.趣味???(←カオスです!)

などなど。。。

 

え、まだテスト段階、仕様定まらず、プロトタイプ段階という事で少しづつ更新&仕様策定をして行きます!!

 

よろしく、お願いします!

2011年9月

        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  

このアーカイブについて

このページには、2009年1月に書かれたブログ記事が新しい順に公開されています。

次のアーカイブは2009年2月です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。