FeedReaderService

2025-07-29 12:46:42 +02:00
parent ced2254068
commit 84960fe5fb
2 changed files with 301 additions and 0 deletions
--- a/src/tests/FeedReaderService.test.ts
+++ b/src/tests/FeedReaderService.test.ts
@@ -0,0 +1,108 @@
 import { FeedReaderService } from '../services/FeedReaderService';
 import { IFeedRepository } from '../repositories/FeedRepository';
 import { NewsSource } from '../types/Feed';
 // Mock dependencies
 jest.mock('../utils/logger');
 jest.mock('../services/ScrapingService');
 jest.mock('../utils/WebScraper');
 jest.mock('../extractors/ElPaisExtractor');
 jest.mock('../extractors/ElMundoExtractor');
 // Mock fetch globally
 global.fetch = jest.fn();
 const mockFeedRepository: jest.Mocked<IFeedRepository> = {
  create: jest.fn(),
  findAll: jest.fn(),
  findById: jest.fn(),
  findByUrl: jest.fn(),
  update: jest.fn(),
  delete: jest.fn(),
  findBySource: jest.fn(),
  findTodaysFrontPage: jest.fn(),
  deleteMany: jest.fn(),
  count: jest.fn(),
  exists: jest.fn()
 };
 // Mock ScrapingService
 const mockScrapingService = {
  processFeedBatch: jest.fn()
 };
 jest.mock('../services/ScrapingService', () => {
  return {
    ScrapingService: jest.fn().mockImplementation(() => mockScrapingService)
  };
 });
 // Mock WebScraper
 const mockWebScraper = {
  scrapeUrl: jest.fn(),
  convertToFeedData: jest.fn()
 };
 jest.mock('../utils/WebScraper', () => {
  return {
    WebScraper: jest.fn().mockImplementation(() => mockWebScraper)
  };
 });
 // Mock extractors
 const mockExtractor = {
  extractNews: jest.fn(),
  isEnabled: jest.fn().mockReturnValue(true),
  getName: jest.fn(),
  getSource: jest.fn()
 };
 const mockElPaisExtractor = {
  ...mockExtractor,
  getName: jest.fn().mockReturnValue('El País'),
  getSource: jest.fn().mockReturnValue(NewsSource.EL_PAIS)
 };
 const mockElMundoExtractor = {
  ...mockExtractor,
  getName: jest.fn().mockReturnValue('El Mundo'),
  getSource: jest.fn().mockReturnValue(NewsSource.EL_MUNDO)
 };
 jest.mock('../extractors/NewspaperExtractorFactory', () => ({
  NewspaperExtractorFactory: {
    getAllAvailableExtractors: jest.fn(() => [mockElPaisExtractor, mockElMundoExtractor]),
    createExtractor: jest.fn((source) => {
      if (source === NewsSource.EL_PAIS) return mockElPaisExtractor;
      if (source === NewsSource.EL_MUNDO) return mockElMundoExtractor;
      return null;
    })
  }
 }));
 describe('FeedReaderService', () => {
  let feedReaderService: FeedReaderService;
  const mockFetch = fetch as jest.MockedFunction<typeof fetch>;
  beforeEach(() => {
    jest.clearAllMocks();
    feedReaderService = new FeedReaderService(mockFeedRepository);
  });
  describe('Constructor and Initialization', () => {
    it('should initialize with available extractors', () => {
      const newspapers = feedReaderService.getAvailableNewspapers();
      expect(newspapers).toHaveLength(2);
      expect(newspapers.map(n => n.source)).toContain(NewsSource.EL_PAIS);
      expect(newspapers.map(n => n.source)).toContain(NewsSource.EL_MUNDO);
    });
    it('should have all extractors enabled by default', () => {
      const newspapers = feedReaderService.getAvailableNewspapers();
      newspapers.forEach(newspaper => {
        expect(newspaper.enabled).toBe(true);
      });
    });
  });
 });
--- a/src/services/FeedReaderService.ts
+++ b/src/services/FeedReaderService.ts
@@ -0,0 +1,193 @@
 import { ScrapingService } from './ScrapingService';
 import { IFeed, NewsSource } from '../types/Feed';
 import { IFeedRepository } from '../repositories/FeedRepository';
 import { Logger } from '../utils/logger';
 import { BaseNewspaperExtractor } from '../extractors/BaseNewspaperExtractor';
 import { NewspaperExtractorFactory } from '../extractors/NewspaperExtractorFactory';
 import { ScrapingResult } from '../types/NewspaperTypes';
 /**
 * Servicio principal de lectura de feeds mediante web scraping
 */
 export class FeedReaderService {
  private scrapingService: ScrapingService;
  private extractors: Map<NewsSource, BaseNewspaperExtractor>;
  constructor(feedRepository: IFeedRepository) {
    this.scrapingService = new ScrapingService(feedRepository);
    this.extractors = new Map();
    this.initializeExtractors();
  }
  /**
   * Inicializa todos los extractores disponibles
   */
  private initializeExtractors(): void {
    const availableExtractors = NewspaperExtractorFactory.getAllAvailableExtractors();
    for (const extractor of availableExtractors) {
      this.extractors.set(extractor.getSource(), extractor);
      Logger.info(`Initialized extractor for ${extractor.getName()}`);
    }
  }
  /**
   * Extrae noticias de un periódico específico
   */
  async extractFromNewspaper(source: NewsSource): Promise<ScrapingResult> {
    const extractor = this.extractors.get(source);
    if (!extractor) {
      const error = `No extractor found for source: ${source}`;
      Logger.error(error);
      return {
        success: 0,
        failed: 1,
        duplicates: 0,
        items: [],
        errors: [error]
      };
    }
    if (!extractor.isEnabled()) {
      Logger.info(`Skipping disabled extractor: ${extractor.getName()}`);
      return {
        success: 0,
        failed: 0,
        duplicates: 0,
        items: [],
        errors: []
      };
    }
    try {
      Logger.info(`Starting extraction for ${extractor.getName()}`);
      const newsItems = await extractor.extractNews();
      if (newsItems.length === 0) {
        Logger.warn(`No news items extracted for ${extractor.getName()}`);
        return {
          success: 0,
          failed: 0,
          duplicates: 0,
          items: [],
          errors: []
        };
      }
      const results = await this.scrapingService.processFeedBatch(newsItems);
      const analyzed = this.analyzeResults(results);
      Logger.info(`Completed extraction for ${extractor.getName()}: ${analyzed.success} success, ${analyzed.failed} failed, ${analyzed.duplicates} duplicates`);
      return analyzed;
    } catch (error) {
      const errorMsg = `Error extracting from ${extractor.getName()}: ${error}`;
      Logger.error(errorMsg);
      return {
        success: 0,
        failed: 1,
        duplicates: 0,
        items: [],
        errors: [errorMsg]
      };
    }
  }
  /**
   * Extrae noticias de todos los periódicos disponibles
   */
  async extractFromAllNewspapers(): Promise<Map<NewsSource, ScrapingResult>> {
    Logger.info(`Starting batch extraction from ${this.extractors.size} newspapers`);
    const results = new Map<NewsSource, ScrapingResult>();
    for (const [source, extractor] of this.extractors) {
      if (extractor.isEnabled()) {
        const result = await this.extractFromNewspaper(source);
        results.set(source, result);
      } else {
        Logger.info(`Skipping disabled newspaper: ${extractor.getName()}`);
      }
    }
    const totalStats = this.calculateTotalStats(results);
    Logger.info(`Batch extraction completed: ${totalStats.success} total success, ${totalStats.failed} total failed, ${totalStats.duplicates} total duplicates`);
    return results;
  }
  /**
   * Obtiene la lista de periódicos disponibles
   */
  getAvailableNewspapers(): { source: NewsSource; name: string; enabled: boolean }[] {
    const newspapers: { source: NewsSource; name: string; enabled: boolean }[] = [];
    for (const [source, extractor] of this.extractors) {
      newspapers.push({
        source,
        name: extractor.getName(),
        enabled: extractor.isEnabled()
      });
    }
    return newspapers;
  }
  /**
   * Habilita o deshabilita un extractor específico
   */
  setExtractorEnabled(source: NewsSource, enabled: boolean): boolean {
    const extractor = this.extractors.get(source);
    if (!extractor) {
      Logger.error(`Cannot set enabled state: No extractor found for source ${source}`);
      return false;
    }
    // Nota: En una implementación real, esto podría modificar la configuración
    // Por ahora, solo registramos el cambio
    Logger.info(`${enabled ? 'Enabled' : 'Disabled'} extractor for ${extractor.getName()}`);
    return true;
  }
  /**
   * Analiza los resultados del procesamiento
   */
  private analyzeResults(results: (IFeed | null)[]): ScrapingResult {
    const success = results.filter(item => item !== null).length;
    const failed = results.filter(item => item === null).length;
    return {
      success,
      failed,
      duplicates: 0, // El ScrapingService maneja duplicados internamente
      items: results,
      errors: []
    };
  }
  /**
   * Calcula estadísticas totales de múltiples resultados
   */
  private calculateTotalStats(results: Map<NewsSource, ScrapingResult>): ScrapingResult {
    let totalSuccess = 0;
    let totalFailed = 0;
    let totalDuplicates = 0;
    const allItems: (IFeed | null)[] = [];
    const allErrors: string[] = [];
    for (const result of results.values()) {
      totalSuccess += result.success;
      totalFailed += result.failed;
      totalDuplicates += result.duplicates;
      allItems.push(...result.items);
      allErrors.push(...result.errors);
    }
    return {
      success: totalSuccess,
      failed: totalFailed,
      duplicates: totalDuplicates,
      items: allItems,
      errors: allErrors
    };
  }
 }