diff --git a/src/model/Inference.py b/src/model/Inference.py index b70dca9..9bafaad 100644 --- a/src/model/Inference.py +++ b/src/model/Inference.py @@ -22,11 +22,22 @@ class FakeNewsInference: return prediction, probabilities[0][prediction].item() -# Usage example + if __name__ == '__main__': - # Inference example - inference = FakeNewsInference('VeriMind') - sample_text = "Breaking news: Scientists discover new planet in solar system" + inference = FakeNewsInference('src/model/VeriMind') + # Beispiel von Postillion + sample_text = """München, Eindhoven (dpo) - Es ist ein wahrer Transfer-Hammer kurz vor Ablauf der offiziellen Frist: Der FC Bayern München verkauft seinen Ehrenpräsidenten Uli Hoeneß für 720.000 Euro an die PSV Eindhoven. + +"Der Vertrag ist unterzeichnet", bestätigte ein sichtlich erleichterter Bayern-Sportvorstand Max Eberl. "Da gibt's nichts mehr dran zu rütteln. Das ist fix. Wir danken Uli für die vielen Jahre der Loyalität und Treue und wünschen ihm einen super Start in den Niederlanden." + +In Eindhoven soll Hoeneß wie bereits bei den Münchnern das Amt des Ehrenpräsidenten übernehmen, der an allen Entscheidungen rumnörgelt, den Trainer vor der Boulevardpresse in die Pfanne haut und mit Fans streitet. + +Die Ablösesumme in Höhe von 720.000 Euro gilt als relativ gering für einen verdienten Fußballfunktionär wie Uli Hoeneß. Insidern zufolge sollen die Münchner der PSV finanziell stark entgegengekommen sein, damit der Deal auch ganz sicher zustande kommt. + +Auch der Zeitpunkt des Wechsels kurz vor Transferschluss gilt als ungewöhnlich, könnte aber das Ziel gehabt haben, Hoeneß zu überrumpeln und sicherzustellen, dass er auf keinen Fall wieder zurückwechselt. + +Angeblich befindet sich der Ex-Bayern-Präsident bereits auf dem Weg nach Eindhoven, wo er nach einem kurzen Medizincheck schon ab Montag zum ersten Mal das Training besuchen und dort Spieler und Trainer anmaulen könnte – vorerst noch mithilfe eines Dolmetschers, bis er die nötigen niederländischen Schimpfwörter gelernt hat. + """ prediction, confidence = inference.predict(sample_text) print(f"Prediction: {'Real' if prediction == 1 else 'Fake'}") print(f"Confidence: {confidence:.4f}") \ No newline at end of file diff --git a/src/model/train.py b/src/model/train.py index 97fa4da..39fd42e 100644 --- a/src/model/train.py +++ b/src/model/train.py @@ -15,15 +15,13 @@ class FakeNewsModelTrainer: self.model.to(self.device) def prepare_data(self, df): - # Combine title and text, handling potential empty values texts = df.apply(lambda row: f"{row['title'] or ''} {row['text'] or ''}".strip(), axis=1).tolist() labels = df['label'].tolist() - # Filter out empty texts valid_texts = [] valid_labels = [] for text, label in zip(texts, labels): - if text.strip(): # Check if the text is not empty after stripping whitespace + if text.strip(): valid_texts.append(text) valid_labels.append(label) @@ -85,9 +83,8 @@ class FakeNewsModelTrainer: self.model.save_pretrained(path) self.tokenizer.save_pretrained(path) -# Usage example + if __name__ == '__main__': - # Load and preprocess the data df = pq.read_table('dataset.parquet').to_pandas() # Split the data