banner

ニュース

Sep 28, 2023

半導体産業における故障の根本原因予測、遺伝的アルゴリズム

Scientific Reports volume 13、記事番号: 4934 (2023) この記事を引用

963 アクセス

11 オルトメトリック

メトリクスの詳細

故障解析は、電子部品の製造プロセスにおいて良好な品質を保証するための重要な部分となっています。 故障解析の結果は、コンポーネントの欠陥を特定し、故障のメカニズムと原因をより深く理解するために使用でき、製品の品質と信頼性を向上させるための修復手順の実装が可能になります。 障害の報告、分析、および是正措置システムは、組織が障害を報告、分類、評価し、是正措置を計画するための方法です。 これらのテキスト特徴データセットは、情報抽出のプロセスを開始し、特定の故障説明の故障結論を予測するための予測モデルを構築する前に、まず自然言語処理技術によって前処理され、ベクトル化手法によって数値に変換される必要があります。 ただし、すべてテキスト情報が故障分析に適した予測モデルの構築に役立つわけではありません。 特徴の選択には、いくつかの変数選択方法が使用されてきました。 それらの中には、大規模なデータセットでの使用に適応していないか、調整が難しいものや、テキストデータには適用できないものもあります。 この記事の目的は、障害記述の識別機能を使用して障害の結論を予測できる予測モデルを開発することです。 このため、故障記述の判別特徴の観点から故障の結論を最適に予測するために、遺伝的アルゴリズムと教師あり学習手法を組み合わせることを提案します。 不均衡なデータセットがあるため、決定木分類器やサポート ベクター マシンなどの教師あり分類法の適合度関数として F1 スコアを適用することを提案します。 提案されたアルゴリズムは GA-DT および GA-SVM と呼ばれます。 故障解析テキスト データセットの実験では、テキスト特徴全体または SVM に基づく遺伝的アルゴリズムによって選択された限定された特徴の情報を使用する場合と比較して、故障結論のより適切な予測モデルを作成する際に、提案された GA-DT 手法の有効性が実証されています。 BLEU スコアやコサイン類似度などの定量的なパフォーマンスは、さまざまなアプローチの予測パフォーマンスを比較するために使用されます。

マイクロエレクトロニクス技術の発展は、技術面と管理面の両方から生産設備のメンテナンスを改善する新たな機会を提供します。 生産におけるこの改善を確立するには、故障分析という重要なステップに焦点を当てる必要があります。 このプロセスは、材料や製品がどのように破損するかを研究するための技術的手順です。 コンポーネントが意図した機能を実行できなくなったときに、どのように、そしてなぜ障害が発生するのかを理解することが重要です1。 障害分析の主な目的は、理想的には障害を除去し、再発を防ぐ方法を特定することを目的として、障害の根本的な原因を特定することです。 客観的な故障分析は、将来の故障の防止、製品やサービスの品質の向上と寿命の延長、経済的側面の最大限の活用に活用できる情報データベースの取得など、多くの良い成果をもたらします2。 私たちのデジタル世界でこれらの主要な基本的な課題に対処するには、障害とその結論を説明する情報データベースを構築し、ますます複雑化する電子システムが確実かつ安全に動作することを保証することが重要です。

多くの組織は、製品の問題を追跡するために、障害報告、分析、および修正措置システム (FRACAS) を使用しています。 FRACAS 技術の主なタスクは 3 です。障害と問題に関する情報の記録と取得、将来の信頼性分析をサポートするための新しい情報の提供、インシデント数の概要レポートの提供、品質パラメーターを測定するための障害データセットとメトリクスの提供です。 FRACAS によって生成された最終レポートを使用して、電子部品やシステムの開発および製造中に欠陥を迅速に評価および発見するための人工知能 (AI) に基づく新しい技術を開発することは、デジタル世界が直面する重要な課題の 1 つです。 データ駆動型メンテナンスを成功させるには、AI と多重構造データ ソースの組み込みが不可欠です。 AI で強化された技術が導入され、複雑な生産システムの信頼性を中心とした保守分析に統合されると、故障率が減少し、可用性が向上します4。

テキスト マイニングは、自然言語処理 (NLP) を適用して、ドキュメントやデータベース内の非構造化テキストを、分析または機械学習 (ML) アルゴリズムのトレーニングに使用できる正規化された構造化データに変換する人工知能 (AI) 技術です5。 テキスト マイニングは、非構造化ドキュメントから情報を抽出し、これまで知られていなかった新しいパターンを特定するための技術でもあります。 次に、特徴または属性の選択です。 このステップでは、マイニング プロセスにとって重要ではない要素の削除に焦点を当てます6。 さらに、このステップにはいくつかの利点があります。計算の複雑さが軽減されます。 決定空間内のノイズを減らし、次元を削減して、より一貫性のある均質なデータセットを実現します7。

私たちの研究では、マイクロエレクトロニクス技術製品の故障解析の説明と故障の結論で構成されるテキスト データセットがあります。 私たちの目的は、故障解析の記述特徴から故障結論特徴を予測できるモデルを構築することです。 ただし、すべてのテキスト情報が予測モデルの構築に価値があるわけではなく、限られた数のアプリオリな特徴を使用するのは難しい場合があります。 特徴選択では、元の入力テキスト変数のサブセットを選択することで次元が削減されます。 言い換えれば、テキスト変数選択戦略は、データを新しいセットに変換せずに最良の最小サブセットを特定することにより、特定の現象に関連する可能性のあるテキスト特徴の次元を削減します8。 予測および分類アルゴリズムの複雑なモデルを実現するために、非情報変数を除外しながら、関連するテキスト変数の選択を実装します。

変数の最適なサブセットを選択するために、さまざまな数学的手法が使用されています。連続投影アルゴリズム 9、後方/前方選択アルゴリズム 10、再重み付けされた適応競合サンプリング、投影のための変数の重要性、非有益な変数の削除 11、区間部分最小二乗回帰 12、モンテカルロ法非情報変数の除去13、粒子群最適化と深層学習アプローチ14、特徴学習強化畳み込みニューラルネットワーク(FLE-CNN)15、競合適応再重み付けサンプリング部分最小二乗法12など。ただし、これらの技術のほとんどはテキストにはあまり適していません。データセット。 一方、これらの方法を適用すると、分析中に多くの情報が失われます。

遺伝的アルゴリズム (GA) は、自然選択の原理をエミュレートする研究手法に属します。 GA は、複雑で大規模なマルチモードのランドスケープで検索を実行し、最適化問題の目的関数または適合関数に対して最適に近いソリューションを提供します16。 ただし、長い文字列表現はテキスト データによく見られる高次元空間で展開されるため、計算時間のコストが高くなります。 遺伝的アルゴリズムは、各染色体が他の染色体と競合する「適者生存」原理に基づいて最良の特徴サブセットを選択するボトムアップ戦略です16。 すなわち、染色体の品質は、所定の適応度関数を使用して評価される。 適応度関数はおそらく、与えられた最適化目標に従って集団内の染色体の品質を測定する役割を持つ GA の最も重要な部分です。 教師あり学習手法を使用すると、特定のアプリケーションに関して、はるかに低次元の部分空間内のテキスト データをより適切に変換できる新しい適合度関数を導き出すことができます17。 文献には、さまざまなタイプの教師ありメソッドが存在します。 最もよく知られているのは、ディシジョン ツリー モデル (DT) とサポート ベクター マシン モデル (SVM) です。 遺伝的アルゴリズムとサポート ベクター マシン手法の組み合わせにより、スパム データセットのテキスト分類精度が向上することを実証する研究が実施されました18。 別の研究では、情報利得と遺伝的アルゴリズムに基づく特徴選択の効率により、テキスト ベクトルの次元が削減され、テキスト分類の精度が向上することが示されています19。 最近の論文では、テキスト分類における文書のより適切な表現を達成するために、遺伝的アルゴリズム指向の潜在意味論的特徴方法論を提案しています20。

したがって、上記すべてに基づいて、GA と教師あり学習手法を組み合わせる動機は次のように要約できます。

遺伝的アルゴリズム (GA) と教師あり学習手法の組み合わせは、機械学習と最適化の分野で人気の研究トピックです。 たとえば、フェルナンデスらによる研究では、 (2002) では、著者らは GA を使用して分類タスクのサポート ベクター マシン (SVM) のパラメーターを最適化し、これら 2 つのアプローチを組み合わせることで、SVM のみを使用した場合と比較してパフォーマンスが向上することを示しました。 Liuらによる別の研究。 (2011) 決定木分類器と組み合わせた特徴選択のための GA ベースのアプローチを提案し、これら 2 つの方法の組み合わせがいくつかのベンチマーク データセットで個々の方法よりも優れていることを示しました。 パラメータの最適化に加えて、GA は深層学習における最適なネットワーク アーキテクチャを検索するためにも使用されています。 たとえば、Real et al. (2017) は、GA を使用して畳み込みニューラル ネットワーク (CNN) のアーキテクチャを進化させる「画像分類器の大規模進化」と呼ばれる方法を提案し、進化したアーキテクチャが CIFAR-10 および CIFAR-10 で手動で設計されたアーキテクチャよりも優れていることを示しました。 100 個の画像分類ベンチマーク。 これらの研究は、GA と教師あり学習手法を組み合わせてさまざまなアプリケーションのパフォーマンスを向上させる可能性を実証し、この分野でのさらなる研究の必要性を強調しています。

一方で、研究のギャップと課題、およびこれらの点をどのように克服しているかは、次のように要約できます。

この研究で最も困難な問題は、おそらく、障害の説明に基づいて障害の結論を正確に予測できる予測モデルを開発するタスクに関連していると考えられます。 これは、モデルが入力特徴とターゲット出力の間の関係を学習する必要があるため、困難なタスクですが、ノイズの多い特徴や無関係な特徴、不均衡なクラス分布、特徴とターゲット間の非線形関係の存在により困難になる場合があります。 。

提案された方法は、遺伝的アルゴリズムと GA-DT と呼ばれる決定木分類器を組み合わせることで、これらの課題に対処します。 GA は、障害の説明から最も識別力の高い特徴のサブセットを検索するために使用され、その後、決定ツリー分類器への入力として使用されます。 そうすることで、GA は分類子が使用する最も有益な特徴のみを選択するため、ノイズの多い特徴や無関係な特徴の問題を克服するのに役立ちます。 さらに、デシジョン ツリーは、不均衡なクラス分布と非線形関係を処理できることが知られているため、このタスクに適しています。

提案された GA-DT モデルの有効性は実験によって実証されており、決定木分類器のみまたは遺伝的アルゴリズムのみを使用する場合と比較してパフォーマンスが向上していることが示されています。 これは、GA と決定木分類器の両方の長所を組み合わせて予測モデルの精度を向上させる、提案された方法の貢献を強調しています。

そこで、本研究の主な目標は、故障解析記述を用いて故障結果を大幅に予測できる高度な予測モデルを構築することです。 もう 1 つの目的は、遺伝的アルゴリズムを使用した教師付き変数選択手法を使用して、非常に多くの単語を含むテキスト データセットからより有益で有用なテキストの特徴を特定する可能性を調査し、提案された方法によって特徴が選択されたかどうかを示すことです。故障結論機能と故障分析記述機能の間の予測モデルのパフォーマンスを大幅に向上させることができます。 我々は、故障解析テキストデータに適用される識別変数を特定するための適合度関数としてF1スコアによって評価される決定木やサポートベクターマシンなどの教師ありモデルと遺伝的アルゴリズムの関連付けに基づく方法論を提案します。 この関数を使用すると、不均衡なデータセットに適用される予測モデルの精度を計算できます。 提案されたアルゴリズムは GA-SVM および GA-DT と呼ばれます。

この記事は次のように構成されています。 2 番目の部分では、特徴選択とは何か、およびそれに関連するアルゴリズムについて説明します。 次に、人口ベースのメタヒューリスティック アルゴリズムの動作原理を詳しく説明します。 特に、遺伝的アルゴリズムと、関連する機能の選択を可能にするその詳細な操作に焦点を当てます。 この研究のこの部分では、メタヒューリスティック アルゴリズムの適合性値を計算するために使用される機械学習アルゴリズムを紹介します。 サポート ベクター マシン (SVM) やデシジョン ツリー (DT) などの教師あり手法について詳しく説明します。 3 番目の部分では、メタヒューリスティックと機械学習アルゴリズムの組み合わせを故障結論特徴と故障分析記述特徴に適用することによって得られた結果を示します。 観察された結果により、トレーニング セット \(70\%\) と \(30 \%\) テスト セット。 最後に、結果について議論した後、特徴選択アルゴリズムと機械学習手法の組み合わせの興味、次元削減におけるその機能とパフォーマンス、およびメタヒューリスティック アルゴリズムに属する他のツールを実装する可能性についての一般的な結論で締めくくります。正解率を向上させます。

エラー訂正出力コード (ECOC) フレームワークは、バイナリ分類器の埋め込みに基づいてマルチクラス分類問題を処理するための基本的かつ効果的な方法です。この場合、分類器はサポート ベクター マシン (SVM) などの複数のバイナリ学習器で構成されます。 ECOC モデル分類器を使用すると、トレーニング データ、パラメータ値、事前確率、およびコーディング行列を保存できます21。 これらの分類器は、新しいデータのラベルや事後確率を予測するなどのタスクを実行することを目的としています。 SVM メソッドを使用したマルチクラス ECOC モデルは、エンコード、バイナリ分類器の学習、およびデコードのステップという 3 つの主要なコンポーネントで構成されます。 コーディング手順では、通常、最初にいくつかのクラスのコーディング行列が決定されます。コーディング行列の各行は特定のクラスを表します。 次に、コーディング行列の各列に従って、元のデータの異なるパーティションに基づいて、独立したバイナリ分類器のグループが形成されます。 最後に、学習されたバイナリ分類器の出力とコーディング行列に基づく復号化手順を通じて、新しいデータが特定のクラスとして予測されます。

\(X=\{x_{j} \}_{j=1}^{n}\) を観測変数の n 個のサンプルの訓練セットとし、d 次元ベクトルが各サンプルを表し、C を次のようにします。 \(x_{j}\) のクラス メンバーシップを示す観測されていない確率変数。ここで \(C \in \{c_{1}, \ldots , c_{k}, \ldots , c_{K} \}\) K はクラスの番号を示します。 \(k^{th}\) クラスの SVM 問題では、クラス \(c_{k}\) が残りのクラスから分離されます。 すべての k 個のバイナリ SVM 分類器が結合されて、最終的なマルチクラス分類器が作成されます。 ここで、残りは \(c_{k}\) 以外のクラスのすべてのデータ点が結合されて 1 つのクラス \(c_{l}\) を形成することを意味します。 標準的な SVM アプローチを使用して、クラス \(c_{k}\) と結合クラス \(c_{l}\) からデータ点を分離する最適な超平面が見つかります。 クラス \(c_{i}\) と結合クラス \(c_{k}\) を区別する最適な分離超平面を次のように表します。

ここで \(w_{k} \in {\mathbb {R}}^{S}\) は重みベクトル、b はバイアス、マッピング関数 \(\phi \) はトレーニング データを適切な特徴空間に投影します。 \({\mathbb {R}}^{S}\) を使用して、非線形の決定曲面を考慮します。 決定関数 \(g_{k} (x_{j})\) のパラメータは、次の最小化によって決定されます23。

の対象となる

スカラー \(y_{j} \in \{-1,+1\}\) がクラス ラベルを表す場合、 \(C \in {\mathbb {R}}^{+}\) は正則化定数であり、 \ ( \xi _{j} \) は、式 (1) の分離可能性の制約を緩和するためにスラック変数を導入できることを示します。 (2)。

ベクトル \(x_{j}\) をクラス \(c_{k}\) に割り当てる決定ルール \(f_{k} (x_{j})\) は次のようになります。

このアプローチの主な難点は、分類器 \(f_{k} (x_{j})\) の出力がバイナリ値であることです。 この問題を処理する通常の方法は、式 1 の符号演算子を無視することです。 (4)。 \( k \in \{1, \ldots , K \}\) に対して \(g_{k} (x_{j})\) によって与えられる最適な超平面をすべて見つけた後、\(x_{j}\ と言います) ) は、決定関数の最大値を持つクラスに属し、次の式で与えられます。

このアプローチでは、 \( k \in \{1, \ldots , K \}\) の判別関数 \(g_{k} (x_{j})\) の最大成分のインデックスがデータに割り当てられます\(x_{j}\) をポイントします。 SVM 分類器の誤り率 \({\mathcal {R}}^{SVM}\) は次のように定義されます。

クラス \(c_{k}\) に属する \(x_{j}\) は、クラス \(\hat{c_{k}}\) のメソッド分類子によって推定され、 \(1_{c_{k \ne \hat{c_{k}}} (x_{j})\) は次のように定義されるインジケーター関数です。

デシジョン ツリー分類子は、データの基礎となる分布に関して事前に統計的な仮定を行う必要のないノンパラメトリック分類子です。 ただし、決定木の基本構造は、1 つのルート ノード、多数の内部ノード、そして最後に一連の終端ノードで構成されます。 ノードは、分割を決定するために使用される予測子のサブセットです。 非終端ノードまたは親ノードは、さらに 2 つの子ノードに分割されたノードです。 ツリーの成長は、非終端ノードを決定するための最適な分割の選択と、各終端ノードのクラスへの割り当てで構成されます25。 データは、定義された分類フレームワークに従って、決定木に沿って再帰的に分割されます。

クラスは、ツリーのその領域でどのクラスが最も一般的に観察されるかを観察することによって、単純に終端ノードに割り当てられます。 したがって、課題は、最適な変数を最適に選択し、その変数を分割して応答間の純度または類似性を最大化することです。 すべての観測値が同じクラスにある場合、親ノード \(\tau \) の不純度は \(i(\tau )\) で示され、ゼロになります。 分割 s は、純度の最大の低下を最適化する最適な予測子と分割値を選択することによって決定されます26。

ここで、 \(\tau _{b}\) は子ノード b を表し、 \(p(\tau _{b}/ \tau )\) は \(\tau \) に割り当てられる観測値の割合です。 \tau _{b}\)、B は分割後の分岐の数です。 2 つの一般的な不純物関数はエントロピー基準 26 です。

およびジニ指数基準

ここで、 \( p_{k}\) は、 \( k \in \{1, \ldots , K \}\) を含むクラス \(c_{k}\) の観測値の割合です。 剪定は、分類率の向上につながる下位の枝を除去する連続的なステップに基づいています。 \(\Delta (s, \tau )\) によって最終的なツリーが決定されると、観測されたクラスと観測 \(x_{j}\) の予測されたクラスを比較することによってその予測パフォーマンスを評価するのが自然です。 \(n_{m}\) の観測値を持つ領域 \(R_{m}\) を表す終端ノード m では、次のようにします。

は、終端ノード m27 におけるクラス \(c_{k}\) の観測値の割合を示します。 ノード m の観測値をクラスに分類します

誤分類エラー率は、単に、ノード内の多数派クラスのメンバーではないノード内の観測値の割合です。

遺伝的アルゴリズム (GA) は、Holland28 の研究を通じて普及した進化的最適化計算の一種です。 これらのアルゴリズムは、その主要原理をコピーすることによるソリューションの自然選択の概念に基づいています。 各ソリューションは、各要素が染色体の形式で表現され、選択されたテキスト特徴が遺伝子として配置された集団として考えることができます28。 GA ステップは、交叉や突然変異などのさまざまな進化操作を再現し、世代ごとに最良の染色体を選択し、最後に適応度関数によって定義された最適化基準に関して最適な染色体を特定することを可能にします29。 図 1 は、GA30 を使用した情報特徴選択手順の手順を示しています。

提案された GA 手法の概要図。

GA は、 \(x_{j }(y) \in {\mathbb を使用してデータ行列 \(X=\{x_{j} (y)\}_{j=1}^{n}\) に適用できます。 {R}}^{d}\)、y は障害説明データセットのテキスト特徴のセットです。 この手順により、これらのそれぞれのケースで最適な染色体 \(z_{0}=[z_{01}\cdots z_{0l} \cdots z_{0L} ] \in {\mathbb {R}}^{L} が得られます。 \) \(z_{0l}\) のテキスト特徴形式 y および L は、選択するために選択された変数の数です。 最適な染色体により、メソッドを適用できる不足次元データの新しいサブデータ行列 \( \{x_{j} (z_{0}) \}_{j=1}^{n}\) を抽出できます。データ分析のこと。 その後、GA の手順について簡単に説明し、記事 31 および 32 で詳しく説明します。

初期化: 初期パラメータは次のとおりです: 染色体サイズ L (それぞれの場合に選択される特徴の数に対応する遺伝子の数)。 集団サイズ N (世代ごとの染色体の数) ; エリート \(N_{e}\) (次世代まで生き残ることが保証されている、現在の世代で最高の適応度値を持つ染色体) の数。 交叉 \(F_{c}\) の割合 ( \(N_{c} = F_{c} \times (N-N_{e }))\)。 停止パラメーターは、最大反復数 T と適応度関数の許容誤差 \(\epsilon \) です。 GA の最初のステップは、開始母集団 P(0) の作成です。 N 個の染色体は、y から L 個の変数をランダムに選択することによって生成されます (\(L < S\) は染色体のサイズです)。

波数変数の初期母集団 P(0) は、最大値と最小値の範囲にわたる一様分布変数のセットからランダムに選択されます 31 。

ここで、 \(z_{i}^{0}\) は、 \(i^{th}\) 母集団の初期変数 \(l^{th}\) を表します。 \(z_{i}^{min}\) と \(z_{i}^{max}\) は、\(l^{th}\) 決定変数の最小値と最大値です。 \( U(z_{i}^{min},z_{i}^{max})\) は、\( [z_{i}^{min},z_{i}^{max] の範囲にわたる一様確率変数を意味します}]\)。 その後、世代を超えて計算が行われます。 世代 (t) ごとに、染色体の集団 \(\{z_{i(t)} \}_{i=1}^{N}\) を取得します。その後のステップにより、別の染色体の集団 \(\{ z_{i(t+1)} \}_{i=1}^{N}\)。

評価: 各染色体\(z_{i(t)}\) は、値 \(F_{i} = F(z_{i(t)})\) を割り当てる適応度関数 F(.) によって評価されます。 \(F_{i}\) の値が小さいほど、対応する染色体が選択される可能性が高くなります。 適応度関数の役割は、指定された最適化目標に従って集団内の染色体の品質を測定することです32。 故障記述データセット X と故障結論データセット Y の間の予測モデルを作成したいため、決定木 (DT) やサポート ベクター マシン (SVM) などの染色体ごとの教師ありモデルを使用して、適合度関数として構築された各モデルの \(F_{1}\) スコアを計算し、得られた予測モデルの品質を評価します。 これらの教師あり学習法の \(F_{1}\) スコアは、予測モデルの精度を評価するための古典的な適応度関数として使用できる最も単純な方法の 1 つです。 適応度関数は次のように定義されます。

ここで、 \(F_{1}^{\text {model}}\) は、精度と再現率の間の調和平均として定義された \(F_{1}\) スコアです。 \(P_{r}^{\text {model}}\) は陽性的中率 (精度)、\(R_{c}^{\text {model}}\) は予測モデルの感度 (再現率) です。 SVMやDTなど。 この関数 (\(F_{1}\) スコア) は、不均衡なクラスの問題を扱うときに非常に役立ちます。 これらは、1 つのクラスがデータ セットを支配できる場合に問題になります。 各適応度関数 \(F_{i}\) について、値は昇順に並べられ、この順序に基づいて最適な \(N_{e}\) 染色体が選択されます。 これらの生き残った染色体は、次の集団で変更されずにコピーされます。

選択: 交配する母集団から親を選択するために使用されます。このステップは、ランク、確率的、ルーレットホイール、確率的普遍サンプリング選択などのさまざまな方法で実装できます。この方法はゼロバイアスであるため、確率的普遍サンプリング選択を選択しました。 、期待される再現率とアルゴリズムのサンプリング周波数の間に偏差がなく、最小の広がりを持っています33。 選択は確率的に実行されるため、個人の選択確率は個人の適応度に比例します。 まず、染色体 \(z_i\) が選択される確率 \(p_{i}\) と累積確率 \(q_{i}\) を計算します。

次に、一様乱数 \(r \in [0, \frac{1}{N}]\) を生成します。 \( r < q_1\) の場合は最初の染色体 \(z_1\) を選択し、それ以外の場合は \(q_{i-1} < r \le q_i\) となる染色体 \(z_i\) を選択します。 昇順の \(F_{i}\) 値を使用すると、次世代まで生き残ることが保証されている \(N_{e}\) 染色体を選択でき、 \(N_{p} = (F_{c} + 1)\times N - 2N_{e}\) 交叉用の親染色体。

クロスオーバー: このステップでは、選択した染色体から遺伝子を抽出し、それらを潜在的に優れた子に組み換えようとします。 ほとんどの場合に良好な結果が得られるため、均一クロスオーバーを選択しました。 遺伝子は、最初の親または 2 番目の親からランダムに選択されます 34。 交叉演算により、 \(N_{c} = (F_{c} \times N) - N_{e}\) の子が得られます。 一様交叉を説明すると、親の染色体 \(p_{1} [z_{iq} ]\)、\( p_{2} [z_{iq} ]\) と子の染色体 \( o_{1} [z_ {iq} ]\)、\( o_{2} [z_{iq} ]\)、\( q = 1 \ldots L\) は遺伝子配列です。 実数間のクロスオーバーの最も一般的なバリアントは、均一クロスオーバーです。 子の染色体 \( z_i\) の q 位置にある遺伝子は次のように計算されます 35:

\(\alpha \) は、\(p_1\)、\(p_2\)、\(o_1\)、\(o_2\) と同じサイズで一様に分布する実数のランダム ベクトルです。ここで、 \(\alpha _{ q} \in [0,1]\)。

子は親からコピーされ、クロスオーバーは式1で取得されます。 (20) および (21):

突然変異: 集団のある世代から次の世代まで遺伝的多様性を維持するために遺伝子の値を変更する遺伝的演算子です。 ほとんどのフィットネス関数に対して最良の結果が得られるため、ガウス演算子を選択しました36。 この演算子は、単位ガウス分布ランダム値を \(N_{p} - 2N_{c}\) 染色体に追加します。 次に、遺伝子の新しい値が最も近い整数に丸められます。 この分布の標準偏差は「スケール」と呼ばれるパラメータで、最初の世代の標準偏差と同じですが、このパラメータは次の世代では「縮小」という別のパラメータによって制御されます。 t 世代目の標準偏差 \(\sigma _{t}\) は、親染色体のすべての座標で同じであり、次の再帰式で求められます37。

ここで、T は世代数です。 「縮小」の値が低いと、遺伝子位置のインデックスにおける突然変異の振幅がわずかに減少します。

ステップ 1 ~ 5 は、最大反復回数 T に達するか、GA が収束するまで、つまり適合度関数値の平均相対変化が許容誤差 \(\epsilon \) 未満になるまで繰り返されます。 この手順により、適応度関数と初期値に応じて最適な染色体 \(z_{0}\) が得られます。 提案された GA ステップの選択により、染色体の初期値がどのように使用されたとしても、同じ最適な染色体が見つかることがわかりました。

BiLingual Evaluation Understudy (BLEU) スコアリング アルゴリズムは、予測ドキュメントと参照ドキュメントのコレクションの間の類似性を評価します。 文書翻訳と要約モデルの品質を評価するために、BLEU スコアを使用します。 n-gram カウント、クリップされた n-gram カウント、修正された n-gram 精度スコア、および簡潔さペナルティは、BLEU スコアの計算に使用されます38。

必要に応じて、クリップされた n-gram カウント関数 Countclip は、各 n-gram グラムのカウントを切り捨て、その n-gram の 1 つの参照で見つかった最大カウントを超えないようにします。 クリップされたカウント関数は次のように定義されます。

ここで、 \(\text {Count}(\text {n-gram})\) は n-gram カウントを表し、\(\text {maxRef}(\text {n-gram})\) は最大の n-gram を表しますその n グラムの単一の参照ドキュメントで観察されたカウント。 更新された N グラム精度スコアは次のように計算されます。

ここで、 n は n グラムの長さ、 \(\text {予測ドキュメント}\) は予測ドキュメント内の文のセット、 D と \(D^{'}\) は予測ドキュメントです。 n グラムの重みベクトル w が与えられると、BLEU スコアの定式化は次のようになります。

ここで、N は n グラムの最大長、\(\bar{p_{n}}\) は修正された n グラム精度の幾何平均、BP は次のように定義される簡潔さのペナルティです。

BLEU スコアは [0, 1] の範囲のスカラー値として返されます。 ゼロに近い BLEU スコアは、予測ドキュメントと参照間の類似性が低いことを示します。 1 に近い BLEU スコアは、強い類似性を示します。 予測ドキュメントが参照ドキュメントの 1 つと同一の場合、スコアは 1 です。

内積空間における 2 つのベクトルの類似性は、コサイン類似度によって測定されます。 2 つのベクトル間の角度の余弦を測定することで、2 つのベクトルが同じ方向を向いているかどうかを判断します。 テキスト分析では、文書の類似性を判断するためによく使用されます39。 コーパス内の文書が互いにどのように関連しているかを見てみましょう。 \(t_{1}\) と \(t_{2}\) を、それぞれドキュメント \(d_{1}\) と \(d_{2}\) のトピックの関連付けを表す 2 つのベクトルとしましょう。ここで、\ (t_{1}^{(k)}\) と \(t_{2}^{(k)}\) は \(d_{1}\) と \(d_{2}\ の項の数です) はそれぞれ主題 k に関連付けられています。 コサイン類似度を使用して、ドキュメントの類似性の尺度を計算できます39。

ここで、 \(\Vert t_{j} \Vert \) はベクトル \(t_{j}\) のノルムを表します。 コサイン類似性スコアは、[0, 1] の範囲のスカラー値を示します。 ゼロに近いコサイン類似度は、予測ドキュメントと参照の間の類似性が低いことを示します。 コサイン類似度が 1 に近い場合は、類似性が強いことを示します。

提案された GA 手法の概要図。

このセクションでは、テキスト データに適用される決定木 (GA-DT) またはサポート ベクター マシン (GA-SVM) モデルと組み合わせた遺伝的アルゴリズムによる変数の選択のために提案された方法論を紹介します。 図 2 は、教師付き変数選択手法を使用して最良のテキスト特徴を抽出し、この分析されたデータの故障説明 X と故障の結論 Y の間の予測モデルを表す故障分析モデリング手法のステップを示しています。 この提案された方法論は 3 つの主要なフェーズで構成されます。 まず、障害分析の説明 X と障害の結論 Y のパイプライン前処理を実行します。データのクリーンアップと準備に失敗すると、予測モデルが損なわれる可能性があるため、これはテキスト データの最も重要で時間のかかる部分です。 フェーズ 2 では、数値データを取得するための前処理されたテキスト データに対する Word2Vec ベクトル化手法の適用を示します。

フェーズ 3 では、ベクトル化された前処理データに対するデシジョン ツリーまたはサポート ベクター マシン教師あり学習と組み合わせた GA 変数選択法の適用を示します。 識別されたテキスト特徴に関して選択された予測モデルの精度を定量化するために、BLEU スコアやコサイン類似度などのさまざまな指標を計算します。 最後に、予測されたテキストの結論と元のテキストの結論を比較して、それらの間の類似性を確認します。

すべてのデータ処理は MATLAB-R2022b 環境を使用して実行され、リクエストに応じてスクリプトを利用できます。

データの説明と分析は、モデリングに先立つ重要なフェーズです。 モデルのパラメータを定義するには、データを正確に表現する必要があります。 マイクロエレクトロニクス製造の故障分析に関するテキスト データセットがあります。 STMicroelectronics が提供した 2019 年から 2021 年の日付の元のデータセットは 2 つの部分で構成されています。1 つ目は故障解析 X (故障要求の原因、サンプルの特性、および故障の詳細) の説明で、2 つ目はその結論 Y (分析の結論、成功率、サイクルタイム)。 表 1 と 2 には、X と Y のさまざまな機能のリストと簡単な説明が含まれています。 このデータは、分析の垂直積み上げから水平積み上げに変換されました。 これは、その説明 (目的、文脈など) と失敗という結論が観察を表すことを意味します。 変換によりデータ サイズは 12,300 の観測値に減少し、19 の前処理された特徴が最新の状態に保たれます。 40で導入された前処理パイプラインを使用してきれいに処理されたデータを取得した後、Word2Vecを使用してベクトル化します。 Genism の Word2Vec 設定は、語彙サイズが 1000 に設定され、最小単語が 341 に設定されていることを除き、維持されます。

私たちのアプローチを形式化する際に、次の表記法を使用します。 \(X= \{x_{ij} \}_{i=1, j=1}^{n, m}\) は、指定されたデータセットの入力空間を表しますここで、n はサンプルの数、m は特徴の数です。 \(Y = \{y_{ij} \}_{i=1, j=1}^{n, p}\) は、結論失敗データセットの出力空間を表します。ここで、p は特徴の数です。

空白や句読点の削除によるノイズの除去、スペルミスの修正、重複インスタンスの削除、テキストの小文字への変換、ストップワードや 3 文字未満の単語の削除はすべて、テキストの前処理の例です。 準備パイプラインの段階から始めます。

記号と英数字の削除: この技術は、記号や場合によっては英数字の単語など、インテリジェンス パターンや分析サンプルに追加されない単語をテキストから削除します。 これらは意味を強調するために使用されるストップワードや語形変化にすぎないため、削除されました42。

トークン化としきい値: トークン化とは、セパレーター 42 を使用して文をトークンに変更または分割することです。 しきい値処理は、特定の長さ以下の単語を削除するために使用される用語です。 この論文では、しきい値を 2 に設定します。

語幹化と見出し語化: これは、テキストの特徴から接辞 (接頭辞と接尾辞) を削除するプロセスです 43。

略語: FRACAS では略語が一般的であるため、元の意味に置き換える必要があります。 この課題を軽減するために、略語の辞書を作成しました。

GA の重要な段階では、アルゴリズムを確実に最適な解に収束させるために、パラメーターを正しく選択する必要があります。 パラメータは次のように初期化されています: エリートの数 \(N_{e} = 2\)、クロスオーバーの割合 \(F_{c} = 0.8\)、最大反復数 \(T=100\) 、母集団サイズ \(N = 100\) と許容誤差 \(\epsilon =10^{-6}\) です。 これらの値は、同様のデータに対して良好な結果が得られるため、GA のいくつかの実装に使用されてきました44。

L と N の最適な値を特定するために、さまざまなサイズの染色体に対して GA が評価されました。 アルゴリズムが収束したとき (許容誤差 \(\epsilon \))、または最大反復回数 (T) に達したとき、適応度関数の最大値を与える値染色体サイズ L が最適値として選択されます (式.28):

GA-SVM と GA-DT の最高の精度は、さまざまなサイズの染色体 \(L=3, \ldots , 8\) に対して評価されました。 図 3 と 4 は、それぞれ GA-DT アルゴリズムと GA-SVM アルゴリズムの適応度値を示しています。 どちらの方法でも \(L = 3\) または 4 が最も高い適合度値を与えることがわかりました。 これは、故障の分析結論の最良の予測モデルを構築するには、4 つの故障記述特徴すべてが必要であることを示しています。

さまざまなサイズの L 染色体に対する GA-DT 適合関数の値。 最適値は、最も高い F1 スコアです。

さまざまなサイズの L 染色体に対する GA-SVM 適合関数の値。 最適値は、最も高い F1 スコアです。

提案された方法論は、2 つの異なるフィットネス関数 (SVM と DT) に適用されています。 GA-SVMおよびGA-DTアルゴリズムにより変数を選択した後、予測モデルの性能を評価する精度(%)、BLEUスコアおよびコサイン類似度を指標として計算し、結論の予測結果を定量化しました。失敗。

精度は最も直観的なパフォーマンス指標であり、単にドキュメント全体に対する正しく予測されたドキュメントの比率です。

TP は真陽性、TN は真陰性、FP は偽陽性、FN は偽陰性を表します。 FP および FN、これらの値は、実際のドキュメントが予測されたドキュメントと矛盾する場合に発生します。 表 3 に示されているこれらの値 (BLEU スコア、コサイン類似度、精度) は、GA-DT では、GA-DT などの他のアルゴリズムと比較して、テキスト サンプルのより優れた予測モデルが失敗の結論 (特徴 Y) を予測できることを確認しています。 SVM。 Y の最初の 4 つの特徴は、GA-DT 法の BLEU スコアとコサイン類似度の良好な精度と良好な値を示していることがわかります。ただし、この変数に記録された各サンプルは大きなテキストであるため、分析の結論である最後のテキスト特徴は除きます。段落。 後者の特徴については、計算されたメトリクス (精度 = 25%、BLEU = 0.32、コサイン = 0.30) が、テキスト データセットに関する他の研究と比較して非常に優れていると言えます。 遺伝的アルゴリズムによる変数選択の適用により、モデルの精度が向上することもわかります。 これらの結果を表 3 に示します。

表 4 に、決定木を備えた遺伝的アルゴリズム (GA-DT) を適用した後に得られた結果の例をいくつか示します。 各故障分析の結論テキスト サンプルに対して、3 つの最良の予測が表示されます。 次に、BLEU スコアを計算して、これらの予測サンプルと元のサンプル間の類似性を定量化します。 BLEU スコアの値が 1 に非常に近いことがわかります。 これは、予測サンプルと参照サンプルの間に強い類似性があることを示しています。

我々は、故障記述の特徴を使用した故障結論の最良の予測モデルの研究のために、判別テキスト特徴を識別するための遺伝的アルゴリズムといくつかの教師付き分類子法の関連付けに基づいた方法論を提案しました。

決定木分類器を適応度関数として使用する遺伝的アルゴリズムの実装により、いくつかの興味深い特徴が特定されました。 ブルー スコアとコサイン類似度は、予測ドキュメントと参照ドキュメントのセットの間の類似性を評価するために使用されます。 予測ドキュメントと参照の間の強い類似性を示す非常に興味深い値が得られました。 また、遺伝的アルゴリズムによる変数選択の適用により、DT または SVM 手法によって取得されたモデルの精度とメトリクスが向上することもわかりました。

提案された GA-DT 方法によって選択された識別特徴は、GA-SVM モデルまたはデシジョン ツリーまたはサポート ベクトルの直接適用と比較して、故障プロセスの記述に従って故障結論の最良の予測モデルを提供することを示しました。マシンは、障害の説明のすべての特徴に適用されます (つまり、事前選択方法はありません)。 観点として、私たちは次の課題に対処することに取り組んでいます。 1) 障害の説明が与えられた場合に障害の結論を生成するための生成シーケンスツーシーケンス言語モデルを適用することにより、モデルのパフォーマンスを向上させる。 2) 障害分析 (FA) の結論 (根本原因) を最もよく予測する最も重要な入力変数を選択するための決定木 (DT) を備えた遺伝的アルゴリズム (GA) に基づく方法論を提案します。 これらの変数は、GPT2 トランスフォーマー モデルなどの障害結論生成用のトランスフォーマー モデルをトレーニングするために使用されます。

研究中に生成または使用されたすべてのデータ、モデル、コードは投稿された論文に記載されており、リクエストに応じて Abbas Rammal に電子メールで連絡して提供されます: [email protected]

Farhat, H. 第 9 章 - 故障分析。 Farhat, H. 編集者、陸上ガスタービンの運転、保守、および修理 (エルゼビア、2021)。

Farshad, M. 第 2 章 - プラスチック パイプの破損調査。 Farshad, M. 編集者、Plastic Pipe Systems、28 ~ 25 ページ (オックスフォード、2006 年)。

Blokdyk, G. 失敗報告分析および是正措置システム完全ガイド (米国品質管理協会、西ウィスコンシン州、2020)。

Google スカラー

アデル、M.ら。 人工知能による画像解析を利用した輪荷重移動試験中のRC床版の疲労破壊の早期損傷検出。 工学構造体。 246、1130–1150 (2021)。

記事 Google Scholar

Mikolov, T.、Sutskever, I.、Chen, K.、Corrado, G. & Dean, J. 単語とフレーズの分散表現とその構成性。 自然言語処理 (NLP) モデルの概要と実証的比較、およびマーケティングにおけるオートエンコーダー モデルの概要と実証的応用 (Burges、CJ 他編) (Curran Associates Inc、米国、2013)。

Google スカラー

Nota, G.、Postiglione, A.、Postiglione, A. & Carvello, R. 予測メンテナンス管理のためのテキスト マイニング技術。 手順計算します。 科学。 200、778–792 (2022)。

記事 Google Scholar

Li, S.、You, M.、Li, D.、Liu, J. テキスト マイニングとベイジアン ネットワーク技術を使用して、炭鉱の安全生産リスク要因を特定します。 プロセスセーフ。 環境。 プロット。 162、1067–1081 (2022)。

記事 CAS Google Scholar

Liu, L.、Kang, J.、Yu, J.、および Wang, Z. テキスト クラスタリングのための教師なし特徴選択方法に関する比較研究、2005 年。自然言語処理と知識工学に関する国際会議で発表された論文、30 –2005 年 10 月 31 日。

ガルバオ、R.ら。 逐次投影アルゴリズムを使用して mlr モデルの倹約性を向上させる変数除去方法。 ケママ。 知性。 研究室システム。 92(1)、83–91 (2008)。

記事 CAS Google Scholar

Derksen, S. & Keselman, H. バックワードフォワードおよびステップワイズ自動サブセット選択アルゴリズム: 本物の変数とノイズ変数を取得する頻度。 Br. J.Math. 統計サイコル。 45(2)、265–282 (1992)。

記事 Google Scholar

Centner, V. et al. 多変量キャリブレーションのための有益でない変数の除去。 アナル。 化学。 68(21)、3851–3858 (1996)。

論文 CAS PubMed Google Scholar

Mehmood, T.、Liland, K.、Snipen, L.、Sæbog, S. 部分最小二乗回帰における変数選択法のレビュー。 ケママ。 知性。 研究室システム。 118、62–69 (2012)。

記事 CAS Google Scholar

Guney, A.、Bozdogan, H.、Arslan, O. 情報の複雑さを使用した線形回帰モデルにおける堅牢なモデル選択。 J.Comput. 応用数学。 398、1 (2021)。

Liu, W.、Wang, Z.、Zeng, N.、Alsaadi, F.、Liu, X. 救急外来の患者を分類するための pso ベースの深層学習アプローチ。 内部。 J.マッハ。 学ぶ。 サイバー。 12、1939 ~ 1948 年 (2021)。

記事 Google Scholar

リー、Hら。 特徴学習の一般化されたフレームワークにより、病理画像指向のがん診断のための畳み込みニューラル ネットワークが強化されました。 計算します。 バイオル。 医学。 151、106265 (2022)。

論文 PubMed Google Scholar

Sivanandam, S. & Deepa, S. 遺伝的アルゴリズムの紹介 (Springer、ベルリン、ドイツ、2008 年)。

数学 Google Scholar

Janikow、CZ 教師あり学習のための知識集約型遺伝的アルゴリズム。 マッハ。 学ぶ。 13、189–228 (1993)。

記事 Google Scholar

Chauhan, A.、Agarwal, A. & Sulthana, R. 遺伝的アルゴリズムとアンサンブル学習は、サポート ベクター マシンを使用したテキスト分類を支援しました。 で。 J.Adv. 計算します。 科学。 応用 12、1 (2021)。

Google スカラー

Lei, S. 情報利得と遺伝的アルゴリズムに基づく特徴選択方法、2012 年。2012 年 3 月 23 ~ 25 日に開催されたコンピューター科学および工学に関する国際会議で発表された論文。

Uysal, A. & Gunal, S. 遺伝的アルゴリズム指向の潜在的な意味論的特徴を使用したテキスト分類。 エキスパートシステム。 応用 41、5938–5947 (2014)。

記事 Google Scholar

James, G. & Hastie, T. エラーコーディング方法と写真。 J.Comput. グラフ。 統計 41、377–387 (1998)。

MathSciNet Google Scholar

Basu, A.、Walters, C.、および Shepherd, M. テキスト分類のためのサポート ベクター マシン、2003 年。2003 年 3 月 23 ~ 25 日に開催された第 36 回年次ハワイ国際会議で発表された論文。

Major, S.、Pant, P. サポート ベクター マシンを使用したドキュメントの分類。 内部。 J.Eng. 科学。 Technol.4 (2012)。

Rahman, S.、Mutalib, S.、Khanafi, N.、および Ali, A. テキスト分類における特徴選択とサポート ベクター マシンの探索、2013 年。第 16 回計算科学および工学に関する国際会議で発表された論文、3-5 2013年12月。

Noormanshah, W.、Nohuddin, P.、Zainol, Z. デシジョン ツリーを使用した文書の分類: 予備調査。 内部。 J.Eng. テクノロジー。 7、437–440 (2018)。

記事 Google Scholar

Aggarwal, C. & Zhai, C. テキスト分類アルゴリズムの調査。 『Mining Text Data』 (Aggarwal, C. 編) (Springer、マサチューセッツ州ボストン、2012 年)。

Google Scholar の章

Suresh, A. & Bharathi, C. デシジョン ツリー ベースの特徴選択を使用した感情分類。 内部。 J. 制御理論応用。 9、419–425 (2016)。

Google スカラー

Holland, J. 自然および人工システムの適応: 生物学、制御、および人工知能への応用を伴う入門分析 (MIT プレス、ロンドン、イギリス、1992 年)。

Google Scholar を予約する

Forrest, S. 遺伝的アルゴリズム: 計算に適用される自然選択の原理。 サイエンス 261、872–878 (1993)。

論文 ADS CAS PubMed Google Scholar

Rammal, A.、Perrin, E.、Vrabie, V.、Assaf, R. & Fenniri, H. ナイーブ ベイズ分類器と遺伝的アルゴリズムを組み合わせた判別可能な中赤外波数の選択: リグノセルロース系バイオマス生分解の評価への応用。 数学。 生物科学。 289、153–161 (2017)。

論文 MathSciNet CAS PubMed MATH Google Scholar

Mitchell, M. 遺伝的アルゴリズム: 概要。 Complexity 1、31–39 (1995)。

記事 ADS MATH Google Scholar

Yangn, M.、Yang, Y. & Su, T. 衛星画像上の土地利用認識のための遺伝的アルゴリズム分類器の効率的な適合関数。 科学。 ワールド J. 1, 1 (2014)

Google スカラー

Ranjini, A. & Zoraida, B. 遺伝的アルゴリズムを使用したジョブショップのスケジューリング問題を解決するための選択スキームの分析。 内部。 J.Res. 工学 2、775–779 (2013)。

Google スカラー

Picek, S. & Goluba, M. バイナリ コード化された遺伝的アルゴリズムにおけるクロスオーバー オペレーターの比較。 WSEASトランス。 計算します。 9、1064–1073 (2010)。

Google スカラー

Goncalves, J.、Mendes, M.、Resende, M. ジョブ ショップ スケジューリング問題のハ​​イブリッド遺伝的アルゴリズム。 ユーロ。 J.Oper. 解像度 167、77–953 (2005)。

記事 MathSciNet MATH Google Scholar

Hinterding、R. Gaussian mutation and self-adaptation for numeric Genetic Algorithms、1995。進化計算に関する ieee 国際会議で発表された論文 (1995 年)。

Deep, K. & Thakury, M. 実際にコード化された遺伝的アルゴリズムのための新しい突然変異オペレーター。 応用数学。 計算します。 193、211–230 (2007)。

MathSciNet MATH Google Scholar

Papineni, K.、Toubakh, S.、Ward, T.、および Zhu, W. Bleu: 機械翻訳の自動評価方法、2002 年。計算言語学協会の第 17 回年次総会で発表された論文、07 ~ 12 2002 年 7 月。

Gunawan, D.、Sembiring, C. & Budiman, M. 2 つのドキュメント間のテキストの関連性を計算するためのコサイン類似度の実装。 J.Phys. 会議サー。 978、1 (2018)。

記事 Google Scholar

Ezukwoke, K.、Toubakh, H.、Hoayek, A.、Batton-Hubert, M.、Boucher, X.、Gounet, P. ディープ クラスタリングによる自然言語処理を使用した半導体インダストリー 4.0 におけるインテリジェントな故障分析の意思決定フロー、2021 年. 2021 年 8 月 23 ~ 27 日に開催された第 17 回オートメーション科学およびエンジニアリングに関する国際会議で発表された論文。

Kamal, M.、Barakbah, A.、および Mubtadai, N. ソーシャルメディア上の ASEAN 自由貿易地域の意見マイニングのための時間感情分析、2016 年。知識創造とインテリジェント コンピューティングに関する国際会議で発表された論文、15-17 ページ(2016年)。

Bharti, K. & Singh, P. テキスト クラスタリングのための特徴選択と特徴抽出方法を統合することによるハイブリッド次元削減。 エキスパートシステム。 応用 42、3105–3114 (2015)。

記事 Google Scholar

Nawangsari, RP、Kusumaningrum, R. & Wibowo, A. ホテルのレビューに対するインドネシア人の感情分析のための Word2vec: 評価調査。 手順計算します。 科学。 157、360–366 (2019)。

記事 Google Scholar

Kristiyanti, D.、Wahyudi, M. 意見マイニング化粧品レビューのための遺伝的アルゴリズム、粒子群の最適化、および主成分分析に基づく機能選択、2017 年。サイバーおよび IT サービス管理に関する第 5 回国際会議で発表された論文、2017 年2017 年 8 月 10 日。

リファレンスをダウンロードする

この研究は、フランスのグルノーブルにある STMicroelectronics 信頼性および故障解析研究所と協力して、Mines Saint-Etienne によって実施されました。

このプロジェクトは、ヨーロッパのプロジェクト FA4.0 の支援によって資金提供されました。

Ecole des Mines de Saint-Etienne、数学および生産工学、組織および環境工学、Henri FAYOL Institute、42023、サンテティエンヌ、フランス

アッバス・ラマル、ケネス・エズクウォーク、アニス・ホアエク、ミレーユ・バトン=ヒューバート

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

指名された著者全員が論文の構築に等しく貢献しました。 AR はこの記事の構造を設計し、新しいアルゴリズムを実行して結果を解釈しました。 AH と MB は、数学的手法の説明と結果の議論に貢献しました。 彼はまた、記事の欠陥を確認し、他の説明を追加しました。 また、言語チェックやその他の説明のために原稿を修正しました。 KEはデータ収集とイラスト部分を担当しました。 彼らはさまざまなソースからデータを収集し、その信頼性をチェックしました。 著者は原稿の出版版を読み、同意しました。

アッバス・ランマルへの通信。

著者らは競合する利害関係を宣言していません。

シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Rammal, A.、Ezukwoke, K.、Hoayek, A. 他。 半導体産業における故障の根本原因予測、遺伝的アルゴリズムと機械学習のアプローチ。 Sci Rep 13、4934 (2023)。 https://doi.org/10.1038/s41598-023-30769-8

引用をダウンロード

受信日: 2022 年 10 月 5 日

受理日: 2023 年 2 月 28 日

公開日: 2023 年 3 月 27 日

DOI: https://doi.org/10.1038/s41598-023-30769-8

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。

共有