.NET & Control > 文字列（Stringクラス）　IT@NET塾

Visual Basic 2010 逆引き大全至高の技データベース+印刷/帳票編 [単行本]

ひと目でわかるMicrosoft Visual C# 2010アプリケーション開発入門 (MSDNプログラミングシリーズ) [単行本]

VisualC# 2010パフェークトマスター―MICROSOFT VISUAL STUDIO 2010 Windows7完全対応、Windows Vista/XP対応 (Perfect Master SERIES) [単行本]

Clearly Visual Basic: Programming With Microsoft Visual Basic 2012 [ペーパーバック]

Beginning Visual Basic 2010 (Wrox Programmer to Programmer) [ペーパーバック]

Visual Basic 2008 逆引きレシピ[Windows アプリケーション編] (PROGRAMMER’S RECiPE) [単行本（ソフトカバー）]

【短時間で学べるプログラミング】 Visual Basic 2008 クイックレシピデータベース編 [大型本]

Beginning Xml With C# 2008: From Novice to Professional (Expert's Voice in .NET) [ペーパーバック]

基礎Visual Basic 2010 (IMPRESS KISO SERIES) [単行本（ソフトカバー）]

明快入門Visual Basic 2008 シニア編 (林晴比古実用マスターシリーズ) [大型本]

C# Programming: From Problem Analysis to Program Design [ペーパーバック]

.Net Framework 4.5 Expert Programming Cookbook [ペーパーバック]

MurachのADO.NET C＃2010では4データベースプログラミング：トレーニング＆リファレンス（Murach：トレーニング参考）[ペーパーバック]

Pro Windows 8 Development With Xaml and C# (Professional Apress) [ペーパーバック]

Top > .NET & Control > 文字列（Stringクラス）

文字列（Stringクラス）

C#の言語仕様で言えば、可変長の文字列を扱う型 stringです。'S'が小文字の's'です。string は、.NET FrameのStringクラスのエイリアス
つまり「別名、またの名前」という意味で同じものです。string はコンパイラがStringクラスと判断してアセンブリに展開します。

また、Stringクラスは sealed で修飾（宣言）されているため、派生することはできません。

Stringクラスの応用クラスとして、Stringsクラスがあります。名前空間はMicrosoft.VisualBasicですが、C#でも使用できます。

Stringクラスの機能

初期化	Stringコンストラクタ
比較	Compare、CompareOrdinal、CompareTo、Equals、EndsWith、StartsWith
検索	IndexOf、IndexOfAny、Contains、LastIndexOf、LastIndexOfAny
コピー	Copy、CopyTo
抽出	Substring
分割	Split
結合	Concat、Join
挿入	Insert
置き換え	Replace
埋込	PadLeft、PadRight
削除	Remove、Trim、TrimEnd、TrimStart
小文字	ToLower、ToLowerInvariant
大文字	ToUpper、ToUpperInvariant
文字数	Length
文字抽出	インデクサ
書式	Format
状態	IsInterned、IsNullOrEmpty
正規化	IsNormalized、Normalize
末尾null	null文字を字列末尾へ埋め込み対応
共通参照	Intern
文字配列	ToCharArray

Stringクラスのコンストラクタ

String型の変数を初期化する場合、文字列はそのまま代入式を使います。

例　String txt = "Text";

文字配列を文字列にする場合は、コンストラクタを使用します。

文字配列には、Charのポインタ、Charの配列、SByteのポインタが指定できます。

コンストラクタの機能は、文字列が分解されたChar配列を任意の位置から任意のサイズで文字列に戻すことができます。

また、バイナリーデータの文字部分を文字列に変換することができます。バイナリーデータはファイルや通信データなどがあって、その一部に文字が含まれている場合があります。これらの機能は、滅多に使用しませんが、知識として知っておくと便利です。

1:String Text = null;
2:sbyte[] sbArr1 = new sbyte[] { 0x41, 0x42, 0x43, 0x00 };
3:
4:unsafe
5:{
6:　fixed (sbyte* pAsciiUpper = sbArr1)
7:　{
8:　　Text = new String(pAsciiUpper);
9:　}
10:}
11:
12:sbyte[] sbArr2 = { 0x61, 0x62, 0x63, 0x00 };
13:
14:unsafe
15:{
16:　fixed (sbyte* pAsciiLower = sbArr2)
17:　{
18:　　Text = new String(pAsciiLower, 0, sbArr2.Length);
19:　}
20:}

1:文字列Textを宣言し、nullで初期化
　2:sbArr1は、sbyteは符号付きbyte型のポインタです。
　　 sbArr1の配列を 'A','B','C',null で初期化
　4:unsafeは、{}ブロック内でポインタを使用することを許可
　6:fixdは、()内で宣言された変数がガベージコレクタに
　　より再配置(メモリ上の移動)を防ぎます。
　　 sbyte* pAsciiUpper = sbArr1 は
　　 sbyte* pAsciiUpper = &sbArr1[0] と等価です。
　　 ※この書き方は、C,C++と同じです。
　8:StringコンストラクタにsbArr1を渡して、Textに文字列が代入されます。
12:sbArr2は、sbyteは符号付きbyte型のポインタです。
　　 sbArr2の配列を 'a','b','c',null で初期化
14:unsafeは、{}ブロック内でポインタを使用することを許可
16:6行と同じ意味
18:StringコンストラクタにsbArr2、配列の開始文字位置、長さを渡して、Textに文字列が代入されます。

バイト配列にUnicode以外の2バイト文字になっている場合、Encodingで指定することができます。
.NETでは、Char型の文字コードはUnicodeです。
ガベージコレクタは、メモリを効率的に使用するため、不要になったオブジェクトを削除したり再配置するための機能です。アプリケーションでは、その処理がいつ行われるのかわかりません。
ポインタとは、データが存在するメモリ上のアドレスを保持する変数です。もし、データが移動すると実際のアドレスと異なる場合が生じる可能性があります。そのため、アプリケーションでは、ガベージコレクタに対してfixedを宣言することで、再配置を抑止することで対処します。
2行目の 0x00（=null）は、文字列の最後を意味するC/C++系の基本的な実装です。

もし、nullが無ければ、…と思って、0x00を削除して警戒しながら実行すると、問題なく正常に動作しました。だったら、{ 0x41, 0x42, 0x43, 0x00, 0x61, 0x62, 0x63, 0x00 };だとどうなるのでしょうか？

予想はしていましたが、結果は "ABC"でした。つまり、配列要素の個数を対象に、nullが現れると終了するということです。途中にnullがなければ配列要素数分を変換します。

これはあくまでも実験結果に基づく仮説です・・・
万が一ですが「データの内容によっては暴走の可能性もある」と考えてプログラミングすべきです。できるだけ、トラブルのリスクを下げる努力をしましょう。C/C++では、暴走したり、データを壊す危険性があります。

Stringのコンストラクタは、高速化を図るためC++のネイティブコードで書かれているので、詳細はわかりません。