Whamcloud - gitweb
8d5f70b02b39f24145011850ef9cc8cc3846e456
[fs/lustre-release.git] / lnet / klnds / qswlnd / qswlnd_cb.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * Copyright (C) 2002 Cluster File Systems, Inc.
5  *   Author: Eric Barton <eric@bartonsoftware.com>
6  *
7  * Copyright (C) 2002, Lawrence Livermore National Labs (LLNL)
8  * W. Marcus Miller - Based on ksocknal
9  *
10  * This file is part of Portals, http://www.sf.net/projects/sandiaportals/
11  *
12  * Portals is free software; you can redistribute it and/or
13  * modify it under the terms of version 2 of the GNU General Public
14  * License as published by the Free Software Foundation.
15  *
16  * Portals is distributed in the hope that it will be useful,
17  * but WITHOUT ANY WARRANTY; without even the implied warranty of
18  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
19  * GNU General Public License for more details.
20  *
21  * You should have received a copy of the GNU General Public License
22  * along with Portals; if not, write to the Free Software
23  * Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
24  *
25  */
26
27 #include "qswnal.h"
28
29 atomic_t kqswnal_packets_launched;
30 atomic_t kqswnal_packets_transmitted;
31 atomic_t kqswnal_packets_received;
32
33
34 /*
35  *  LIB functions follow
36  *
37  */
38 static int
39 kqswnal_read(nal_cb_t *nal, void *private, void *dst_addr, user_ptr src_addr,
40              size_t len)
41 {
42         CDEBUG (D_NET, LPX64": reading "LPSZ" bytes from %p -> %p\n",
43                 nal->ni.nid, len, src_addr, dst_addr );
44         memcpy( dst_addr, src_addr, len );
45
46         return (0);
47 }
48
49 static int
50 kqswnal_write(nal_cb_t *nal, void *private, user_ptr dst_addr, void *src_addr,
51               size_t len)
52 {
53         CDEBUG (D_NET, LPX64": writing "LPSZ" bytes from %p -> %p\n",
54                 nal->ni.nid, len, src_addr, dst_addr );
55         memcpy( dst_addr, src_addr, len );
56
57         return (0);
58 }
59
60 static void *
61 kqswnal_malloc(nal_cb_t *nal, size_t len)
62 {
63         void *buf;
64
65         PORTAL_ALLOC(buf, len);
66         return (buf);
67 }
68
69 static void
70 kqswnal_free(nal_cb_t *nal, void *buf, size_t len)
71 {
72         PORTAL_FREE(buf, len);
73 }
74
75 static void
76 kqswnal_printf (nal_cb_t * nal, const char *fmt, ...)
77 {
78         va_list ap;
79         char msg[256];
80
81         va_start (ap, fmt);
82         vsnprintf (msg, sizeof (msg), fmt, ap);        /* sprint safely */
83         va_end (ap);
84
85         msg[sizeof (msg) - 1] = 0;                /* ensure terminated */
86
87         CDEBUG (D_NET, "%s", msg);
88 }
89
90
91 static void
92 kqswnal_cli(nal_cb_t *nal, unsigned long *flags)
93 {
94         kqswnal_data_t *data= nal->nal_data;
95
96         spin_lock_irqsave(&data->kqn_statelock, *flags);
97 }
98
99
100 static void
101 kqswnal_sti(nal_cb_t *nal, unsigned long *flags)
102 {
103         kqswnal_data_t *data= nal->nal_data;
104
105         spin_unlock_irqrestore(&data->kqn_statelock, *flags);
106 }
107
108
109 static int
110 kqswnal_dist(nal_cb_t *nal, ptl_nid_t nid, unsigned long *dist)
111 {
112         if (nid == nal->ni.nid)
113                 *dist = 0;                      /* it's me */
114         else if (kqswnal_nid2elanid (nid) >= 0)
115                 *dist = 1;                      /* it's my peer */
116         else
117                 *dist = 2;                      /* via router */
118         return (0);
119 }
120
121 void
122 kqswnal_unmap_tx (kqswnal_tx_t *ktx)
123 {
124         if (ktx->ktx_nmappedpages == 0)
125                 return;
126
127         CDEBUG (D_NET, "%p[%d] unloading pages %d for %d\n",
128                 ktx, ktx->ktx_niov, ktx->ktx_basepage, ktx->ktx_nmappedpages);
129
130         LASSERT (ktx->ktx_nmappedpages <= ktx->ktx_npages);
131         LASSERT (ktx->ktx_basepage + ktx->ktx_nmappedpages <=
132                  kqswnal_data.kqn_eptxdmahandle->NumDvmaPages);
133
134         elan3_dvma_unload(kqswnal_data.kqn_epdev->DmaState,
135                           kqswnal_data.kqn_eptxdmahandle,
136                           ktx->ktx_basepage, ktx->ktx_nmappedpages);
137         ktx->ktx_nmappedpages = 0;
138 }
139
140 int
141 kqswnal_map_tx_kiov (kqswnal_tx_t *ktx, int nob, int niov, ptl_kiov_t *kiov)
142 {
143         int       nfrags    = ktx->ktx_niov;
144         const int maxfrags  = sizeof (ktx->ktx_iov)/sizeof (ktx->ktx_iov[0]);
145         int       nmapped   = ktx->ktx_nmappedpages;
146         int       maxmapped = ktx->ktx_npages;
147         uint32_t  basepage  = ktx->ktx_basepage + nmapped;
148         char     *ptr;
149         
150         LASSERT (nmapped <= maxmapped);
151         LASSERT (nfrags <= maxfrags);
152         LASSERT (niov > 0);
153         LASSERT (nob > 0);
154         
155         do {
156                 int  fraglen = kiov->kiov_len;
157
158                 /* nob exactly spans the iovs */
159                 LASSERT (fraglen <= nob);
160                 /* each frag fits in a page */
161                 LASSERT (kiov->kiov_offset + kiov->kiov_len <= PAGE_SIZE);
162
163                 nmapped++;
164                 if (nmapped > maxmapped) {
165                         CERROR("Can't map message in %d pages (max %d)\n",
166                                nmapped, maxmapped);
167                         return (-EMSGSIZE);
168                 }
169
170                 if (nfrags == maxfrags) {
171                         CERROR("Message too fragmented in Elan VM (max %d frags)\n",
172                                maxfrags);
173                         return (-EMSGSIZE);
174                 }
175
176                 /* XXX this is really crap, but we'll have to kmap until
177                  * EKC has a page (rather than vaddr) mapping interface */
178
179                 ptr = ((char *)kmap (kiov->kiov_page)) + kiov->kiov_offset;
180
181                 CDEBUG(D_NET,
182                        "%p[%d] loading %p for %d, page %d, %d total\n",
183                         ktx, nfrags, ptr, fraglen, basepage, nmapped);
184
185                 elan3_dvma_kaddr_load (kqswnal_data.kqn_epdev->DmaState,
186                                        kqswnal_data.kqn_eptxdmahandle,
187                                        ptr, fraglen,
188                                        basepage, &ktx->ktx_iov[nfrags].Base);
189
190                 kunmap (kiov->kiov_page);
191                 
192                 /* keep in loop for failure case */
193                 ktx->ktx_nmappedpages = nmapped;
194
195                 if (nfrags > 0 &&                /* previous frag mapped */
196                     ktx->ktx_iov[nfrags].Base == /* contiguous with this one */
197                     (ktx->ktx_iov[nfrags-1].Base + ktx->ktx_iov[nfrags-1].Len))
198                         /* just extend previous */
199                         ktx->ktx_iov[nfrags - 1].Len += fraglen;
200                 else {
201                         ktx->ktx_iov[nfrags].Len = fraglen;
202                         nfrags++;                /* new frag */
203                 }
204
205                 basepage++;
206                 kiov++;
207                 niov--;
208                 nob -= fraglen;
209
210                 /* iov must not run out before end of data */
211                 LASSERT (nob == 0 || niov > 0);
212
213         } while (nob > 0);
214
215         ktx->ktx_niov = nfrags;
216         CDEBUG (D_NET, "%p got %d frags over %d pages\n",
217                 ktx, ktx->ktx_niov, ktx->ktx_nmappedpages);
218
219         return (0);
220 }
221
222 int
223 kqswnal_map_tx_iov (kqswnal_tx_t *ktx, int nob, int niov, struct iovec *iov)
224 {
225         int       nfrags    = ktx->ktx_niov;
226         const int maxfrags  = sizeof (ktx->ktx_iov)/sizeof (ktx->ktx_iov[0]);
227         int       nmapped   = ktx->ktx_nmappedpages;
228         int       maxmapped = ktx->ktx_npages;
229         uint32_t  basepage  = ktx->ktx_basepage + nmapped;
230
231         LASSERT (nmapped <= maxmapped);
232         LASSERT (nfrags <= maxfrags);
233         LASSERT (niov > 0);
234         LASSERT (nob > 0);
235
236         do {
237                 int  fraglen = iov->iov_len;
238                 long npages  = kqswnal_pages_spanned (iov->iov_base, fraglen);
239
240                 /* nob exactly spans the iovs */
241                 LASSERT (fraglen <= nob);
242                 
243                 nmapped += npages;
244                 if (nmapped > maxmapped) {
245                         CERROR("Can't map message in %d pages (max %d)\n",
246                                nmapped, maxmapped);
247                         return (-EMSGSIZE);
248                 }
249
250                 if (nfrags == maxfrags) {
251                         CERROR("Message too fragmented in Elan VM (max %d frags)\n",
252                                maxfrags);
253                         return (-EMSGSIZE);
254                 }
255
256                 CDEBUG(D_NET,
257                        "%p[%d] loading %p for %d, pages %d for %ld, %d total\n",
258                         ktx, nfrags, iov->iov_base, fraglen, basepage, npages,
259                         nmapped);
260
261                 elan3_dvma_kaddr_load (kqswnal_data.kqn_epdev->DmaState,
262                                        kqswnal_data.kqn_eptxdmahandle,
263                                        iov->iov_base, fraglen,
264                                        basepage, &ktx->ktx_iov[nfrags].Base);
265                 /* keep in loop for failure case */
266                 ktx->ktx_nmappedpages = nmapped;
267
268                 if (nfrags > 0 &&                /* previous frag mapped */
269                     ktx->ktx_iov[nfrags].Base == /* contiguous with this one */
270                     (ktx->ktx_iov[nfrags-1].Base + ktx->ktx_iov[nfrags-1].Len))
271                         /* just extend previous */
272                         ktx->ktx_iov[nfrags - 1].Len += fraglen;
273                 else {
274                         ktx->ktx_iov[nfrags].Len = fraglen;
275                         nfrags++;                /* new frag */
276                 }
277
278                 basepage += npages;
279                 iov++;
280                 niov--;
281                 nob -= fraglen;
282
283                 /* iov must not run out before end of data */
284                 LASSERT (nob == 0 || niov > 0);
285
286         } while (nob > 0);
287
288         ktx->ktx_niov = nfrags;
289         CDEBUG (D_NET, "%p got %d frags over %d pages\n",
290                 ktx, ktx->ktx_niov, ktx->ktx_nmappedpages);
291
292         return (0);
293 }
294
295 void
296 kqswnal_put_idle_tx (kqswnal_tx_t *ktx)
297 {
298         kpr_fwd_desc_t   *fwd = NULL;
299         unsigned long     flags;
300
301         kqswnal_unmap_tx (ktx);                 /* release temporary mappings */
302
303         spin_lock_irqsave (&kqswnal_data.kqn_idletxd_lock, flags);
304
305         list_del (&ktx->ktx_list);              /* take off active list */
306
307         if (ktx->ktx_isnblk) {
308                 /* reserved for non-blocking tx */
309                 list_add (&ktx->ktx_list, &kqswnal_data.kqn_nblk_idletxds);
310                 spin_unlock_irqrestore (&kqswnal_data.kqn_idletxd_lock, flags);
311                 return;
312         }
313
314         list_add (&ktx->ktx_list, &kqswnal_data.kqn_idletxds);
315
316         /* anything blocking for a tx descriptor? */
317         if (!list_empty(&kqswnal_data.kqn_idletxd_fwdq)) /* forwarded packet? */
318         {
319                 CDEBUG(D_NET,"wakeup fwd\n");
320
321                 fwd = list_entry (kqswnal_data.kqn_idletxd_fwdq.next,
322                                   kpr_fwd_desc_t, kprfd_list);
323                 list_del (&fwd->kprfd_list);
324         }
325
326         if (waitqueue_active (&kqswnal_data.kqn_idletxd_waitq))  /* process? */
327         {
328                 /* local sender waiting for tx desc */
329                 CDEBUG(D_NET,"wakeup process\n");
330                 wake_up (&kqswnal_data.kqn_idletxd_waitq);
331         }
332
333         spin_unlock_irqrestore (&kqswnal_data.kqn_idletxd_lock, flags);
334
335         if (fwd == NULL)
336                 return;
337
338         /* schedule packet for forwarding again */
339         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
340
341         list_add_tail (&fwd->kprfd_list, &kqswnal_data.kqn_delayedfwds);
342         if (waitqueue_active (&kqswnal_data.kqn_sched_waitq))
343                 wake_up (&kqswnal_data.kqn_sched_waitq);
344
345         spin_unlock_irqrestore (&kqswnal_data.kqn_sched_lock, flags);
346 }
347
348 kqswnal_tx_t *
349 kqswnal_get_idle_tx (kpr_fwd_desc_t *fwd, int may_block)
350 {
351         unsigned long  flags;
352         kqswnal_tx_t  *ktx = NULL;
353
354         for (;;) {
355                 spin_lock_irqsave (&kqswnal_data.kqn_idletxd_lock, flags);
356
357                 /* "normal" descriptor is free */
358                 if (!list_empty (&kqswnal_data.kqn_idletxds)) {
359                         ktx = list_entry (kqswnal_data.kqn_idletxds.next,
360                                           kqswnal_tx_t, ktx_list);
361                         break;
362                 }
363
364                 /* "normal" descriptor pool is empty */
365
366                 if (fwd != NULL) { /* forwarded packet => queue for idle txd */
367                         CDEBUG (D_NET, "blocked fwd [%p]\n", fwd);
368                         list_add_tail (&fwd->kprfd_list,
369                                        &kqswnal_data.kqn_idletxd_fwdq);
370                         break;
371                 }
372
373                 /* doing a local transmit */
374                 if (!may_block) {
375                         if (list_empty (&kqswnal_data.kqn_nblk_idletxds)) {
376                                 CERROR ("intr tx desc pool exhausted\n");
377                                 break;
378                         }
379
380                         ktx = list_entry (kqswnal_data.kqn_nblk_idletxds.next,
381                                           kqswnal_tx_t, ktx_list);
382                         break;
383                 }
384
385                 /* block for idle tx */
386
387                 spin_unlock_irqrestore (&kqswnal_data.kqn_idletxd_lock, flags);
388
389                 CDEBUG (D_NET, "blocking for tx desc\n");
390                 wait_event (kqswnal_data.kqn_idletxd_waitq,
391                             !list_empty (&kqswnal_data.kqn_idletxds));
392         }
393
394         if (ktx != NULL) {
395                 list_del (&ktx->ktx_list);
396                 list_add (&ktx->ktx_list, &kqswnal_data.kqn_activetxds);
397                 ktx->ktx_launcher = current->pid;
398         }
399
400         spin_unlock_irqrestore (&kqswnal_data.kqn_idletxd_lock, flags);
401
402         /* Idle descs can't have any mapped (as opposed to pre-mapped) pages */
403         LASSERT (ktx == NULL || ktx->ktx_nmappedpages == 0);
404         return (ktx);
405 }
406
407 void
408 kqswnal_tx_done (kqswnal_tx_t *ktx, int error)
409 {
410         if (ktx->ktx_forwarding)                /* router asked me to forward this packet */
411                 kpr_fwd_done (&kqswnal_data.kqn_router,
412                               (kpr_fwd_desc_t *)ktx->ktx_args[0], error);
413         else                                    /* packet sourced locally */
414                 lib_finalize (&kqswnal_lib, ktx->ktx_args[0],
415                               (lib_msg_t *)ktx->ktx_args[1]);
416
417         kqswnal_put_idle_tx (ktx);
418 }
419
420 static void
421 kqswnal_txhandler(EP_TXD *txd, void *arg, int status)
422 {
423         kqswnal_tx_t      *ktx = (kqswnal_tx_t *)arg;
424
425         LASSERT (txd != NULL);
426         LASSERT (ktx != NULL);
427
428         CDEBUG(D_NET, "txd %p, arg %p status %d\n", txd, arg, status);
429
430         if (status == EP_SUCCESS)
431                 atomic_inc (&kqswnal_packets_transmitted);
432
433         if (status != EP_SUCCESS)
434         {
435                 CERROR ("kqswnal: Transmit failed with %d\n", status);
436                 status = -EIO;
437         }
438
439         kqswnal_tx_done (ktx, status);
440 }
441
442 int
443 kqswnal_launch (kqswnal_tx_t *ktx)
444 {
445         /* Don't block for transmit descriptor if we're in interrupt context */
446         int   attr = in_interrupt() ? (EP_NO_SLEEP | EP_NO_ALLOC) : 0;
447         int   dest = kqswnal_nid2elanid (ktx->ktx_nid);
448         long  flags;
449         int   rc;
450         
451         LASSERT (dest >= 0);                    /* must be a peer */
452         rc = ep_transmit_large(kqswnal_data.kqn_eptx, dest,
453                                ktx->ktx_port, attr, kqswnal_txhandler,
454                                ktx, ktx->ktx_iov, ktx->ktx_niov);
455         if (rc == 0)
456                 atomic_inc (&kqswnal_packets_launched);
457
458         if (rc != ENOMEM)
459                 return (rc);
460
461         /* can't allocate ep txd => queue for later */
462
463         LASSERT (in_interrupt());      /* not called by thread (not looping) */
464
465         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
466
467         list_add_tail (&ktx->ktx_delayed_list, &kqswnal_data.kqn_delayedtxds);
468         if (waitqueue_active (&kqswnal_data.kqn_sched_waitq))
469                 wake_up (&kqswnal_data.kqn_sched_waitq);
470
471         spin_unlock_irqrestore (&kqswnal_data.kqn_sched_lock, flags);
472
473         return (0);
474 }
475
476
477 static char *
478 hdr_type_string (ptl_hdr_t *hdr)
479 {
480         switch (hdr->type) {
481         case PTL_MSG_ACK:
482                 return ("ACK");
483         case PTL_MSG_PUT:
484                 return ("PUT");
485         case PTL_MSG_GET:
486                 return ("GET");
487         case PTL_MSG_REPLY:
488                 return ("REPLY");
489         default:
490                 return ("<UNKNOWN>");
491         }
492 }
493
494 static void
495 kqswnal_cerror_hdr(ptl_hdr_t * hdr)
496 {
497         char *type_str = hdr_type_string (hdr);
498
499         CERROR("P3 Header at %p of type %s\n", hdr, type_str);
500         CERROR("    From nid/pid "LPU64"/%u", NTOH__u64(hdr->src_nid),
501                NTOH__u32(hdr->src_pid));
502         CERROR("    To nid/pid "LPU64"/%u\n", NTOH__u64(hdr->dest_nid),
503                NTOH__u32(hdr->dest_pid));
504
505         switch (NTOH__u32(hdr->type)) {
506         case PTL_MSG_PUT:
507                 CERROR("    Ptl index %d, ack md "LPX64"."LPX64", "
508                        "match bits "LPX64"\n",
509                        NTOH__u32 (hdr->msg.put.ptl_index),
510                        hdr->msg.put.ack_wmd.wh_interface_cookie,
511                        hdr->msg.put.ack_wmd.wh_object_cookie,
512                        NTOH__u64 (hdr->msg.put.match_bits));
513                 CERROR("    Length %d, offset %d, hdr data "LPX64"\n",
514                        NTOH__u32(PTL_HDR_LENGTH(hdr)),
515                        NTOH__u32(hdr->msg.put.offset),
516                        hdr->msg.put.hdr_data);
517                 break;
518
519         case PTL_MSG_GET:
520                 CERROR("    Ptl index %d, return md "LPX64"."LPX64", "
521                        "match bits "LPX64"\n",
522                        NTOH__u32 (hdr->msg.get.ptl_index),
523                        hdr->msg.get.return_wmd.wh_interface_cookie,
524                        hdr->msg.get.return_wmd.wh_object_cookie,
525                        hdr->msg.get.match_bits);
526                 CERROR("    Length %d, src offset %d\n",
527                        NTOH__u32 (hdr->msg.get.sink_length),
528                        NTOH__u32 (hdr->msg.get.src_offset));
529                 break;
530
531         case PTL_MSG_ACK:
532                 CERROR("    dst md "LPX64"."LPX64", manipulated length %d\n",
533                        hdr->msg.ack.dst_wmd.wh_interface_cookie,
534                        hdr->msg.ack.dst_wmd.wh_object_cookie,
535                        NTOH__u32 (hdr->msg.ack.mlength));
536                 break;
537
538         case PTL_MSG_REPLY:
539                 CERROR("    dst md "LPX64"."LPX64", length %d\n",
540                        hdr->msg.reply.dst_wmd.wh_interface_cookie,
541                        hdr->msg.reply.dst_wmd.wh_object_cookie,
542                        NTOH__u32 (PTL_HDR_LENGTH(hdr)));
543         }
544
545 }                               /* end of print_hdr() */
546
547 static int
548 kqswnal_sendmsg (nal_cb_t     *nal,
549                  void         *private,
550                  lib_msg_t    *cookie,
551                  ptl_hdr_t    *hdr,
552                  int           type,
553                  ptl_nid_t     nid,
554                  ptl_pid_t     pid,
555                  unsigned int  payload_niov,
556                  struct iovec *payload_iov,
557                  ptl_kiov_t   *payload_kiov,
558                  size_t        payload_nob)
559 {
560         kqswnal_tx_t      *ktx;
561         int                rc;
562         ptl_nid_t          gatewaynid;
563 #if KQSW_CHECKSUM
564         int                i;
565         kqsw_csum_t        csum;
566         int                sumnob;
567 #endif
568         
569         CDEBUG(D_NET, "sending "LPSZ" bytes in %d frags to nid: "LPX64
570                " pid %u\n", payload_nob, payload_niov, nid, pid);
571
572         LASSERT (payload_nob == 0 || payload_niov > 0);
573         LASSERT (payload_niov <= PTL_MD_MAX_IOV);
574
575         /* It must be OK to kmap() if required */
576         LASSERT (payload_kiov == NULL || !in_interrupt ());
577         /* payload is either all vaddrs or all pages */
578         LASSERT (!(payload_kiov != NULL && payload_iov != NULL));
579         
580         if (payload_nob > KQSW_MAXPAYLOAD) {
581                 CERROR ("request exceeds MTU size "LPSZ" (max %u).\n",
582                         payload_nob, KQSW_MAXPAYLOAD);
583                 return (PTL_FAIL);
584         }
585
586         if (kqswnal_nid2elanid (nid) < 0) {     /* Can't send direct: find gateway? */
587                 rc = kpr_lookup (&kqswnal_data.kqn_router, nid, &gatewaynid);
588                 if (rc != 0) {
589                         CERROR("Can't route to "LPX64": router error %d\n",
590                                nid, rc);
591                         return (PTL_FAIL);
592                 }
593                 if (kqswnal_nid2elanid (gatewaynid) < 0) {
594                         CERROR("Bad gateway "LPX64" for "LPX64"\n",
595                                gatewaynid, nid);
596                         return (PTL_FAIL);
597                 }
598                 nid = gatewaynid;
599         }
600
601         /* I may not block for a transmit descriptor if I might block the
602          * receiver, or an interrupt handler. */
603         ktx = kqswnal_get_idle_tx(NULL, !(type == PTL_MSG_ACK ||
604                                           type == PTL_MSG_REPLY ||
605                                           in_interrupt()));
606         if (ktx == NULL) {
607                 kqswnal_cerror_hdr (hdr);
608                 return (PTL_NOSPACE);
609         }
610
611         memcpy (ktx->ktx_buffer, hdr, sizeof (*hdr)); /* copy hdr from caller's stack */
612         ktx->ktx_wire_hdr = (ptl_hdr_t *)ktx->ktx_buffer;
613
614 #if KQSW_CHECKSUM
615         csum = kqsw_csum (0, (char *)hdr, sizeof (*hdr));
616         memcpy (ktx->ktx_buffer + sizeof (*hdr), &csum, sizeof (csum));
617         for (csum = 0, i = 0, sumnob = payload_nob; sumnob > 0; i++) {
618                 if (payload_kiov != NULL) {
619                         ptl_kiov_t *kiov = &payload_kiov[i];
620                         char       *addr = ((char *)kmap (kiov->kiov_page)) +
621                                            kiov->kiov_offset;
622                         
623                         csum = kqsw_csum (csum, addr, MIN (sumnob, kiov->kiov_len));
624                         sumnob -= kiov->kiov_len;
625                 } else {
626                         struct iovec *iov = &payload_iov[i];
627
628                         csum = kqsw_csum (csum, iov->iov_base, MIN (sumnob, kiov->iov_len));
629                         sumnob -= iov->iov_len;
630                 }
631         }
632         memcpy(ktx->ktx_buffer +sizeof(*hdr) +sizeof(csum), &csum,sizeof(csum));
633 #endif
634
635         /* Set up first frag from pre-mapped buffer (it's at least the
636          * portals header) */
637         ktx->ktx_iov[0].Base = ktx->ktx_ebuffer;
638         ktx->ktx_iov[0].Len = KQSW_HDR_SIZE;
639         ktx->ktx_niov = 1;
640
641         if (payload_nob > 0) { /* got some payload (something more to do) */
642                 /* make a single contiguous message? */
643                 if (payload_nob <= KQSW_TX_MAXCONTIG) {
644                         /* copy payload to ktx_buffer, immediately after hdr */
645                         if (payload_kiov != NULL)
646                                 lib_copy_kiov2buf (ktx->ktx_buffer + KQSW_HDR_SIZE,
647                                                    payload_niov, payload_kiov, payload_nob);
648                         else
649                                 lib_copy_iov2buf (ktx->ktx_buffer + KQSW_HDR_SIZE,
650                                                   payload_niov, payload_iov, payload_nob);
651                         /* first frag includes payload */
652                         ktx->ktx_iov[0].Len += payload_nob;
653                 } else {
654                         if (payload_kiov != NULL)
655                                 rc = kqswnal_map_tx_kiov (ktx, payload_nob, 
656                                                           payload_niov, payload_kiov);
657                         else
658                                 rc = kqswnal_map_tx_iov (ktx, payload_nob,
659                                                          payload_niov, payload_iov);
660                         if (rc != 0) {
661                                 kqswnal_put_idle_tx (ktx);
662                                 return (PTL_FAIL);
663                         }
664                 } 
665         }
666
667         ktx->ktx_port       = (payload_nob <= KQSW_SMALLPAYLOAD) ?
668                               EP_SVC_LARGE_PORTALS_SMALL : EP_SVC_LARGE_PORTALS_LARGE;
669         ktx->ktx_nid        = nid;
670         ktx->ktx_forwarding = 0;   /* => lib_finalize() on completion */
671         ktx->ktx_args[0]    = private;
672         ktx->ktx_args[1]    = cookie;
673
674         rc = kqswnal_launch (ktx);
675         if (rc != 0) {                    /* failed? */
676                 CERROR ("Failed to send packet to "LPX64": %d\n", nid, rc);
677                 kqswnal_put_idle_tx (ktx);
678                 return (PTL_FAIL);
679         }
680
681         CDEBUG(D_NET, "send to "LPSZ" bytes to "LPX64"\n", payload_nob, nid);
682         return (PTL_OK);
683 }
684
685 static int
686 kqswnal_send (nal_cb_t     *nal,
687               void         *private,
688               lib_msg_t    *cookie,
689               ptl_hdr_t    *hdr,
690               int           type,
691               ptl_nid_t     nid,
692               ptl_pid_t     pid,
693               unsigned int  payload_niov,
694               struct iovec *payload_iov,
695               size_t        payload_nob)
696 {
697         return (kqswnal_sendmsg (nal, private, cookie, hdr, type, nid, pid,
698                                  payload_niov, payload_iov, NULL, payload_nob));
699 }
700
701 static int
702 kqswnal_send_pages (nal_cb_t     *nal,
703                     void         *private,
704                     lib_msg_t    *cookie,
705                     ptl_hdr_t    *hdr,
706                     int           type,
707                     ptl_nid_t     nid,
708                     ptl_pid_t     pid,
709                     unsigned int  payload_niov,
710                     ptl_kiov_t   *payload_kiov,
711                     size_t        payload_nob)
712 {
713         return (kqswnal_sendmsg (nal, private, cookie, hdr, type, nid, pid,
714                                  payload_niov, NULL, payload_kiov, payload_nob));
715 }
716
717 int kqswnal_fwd_copy_contig = 0;
718
719 void
720 kqswnal_fwd_packet (void *arg, kpr_fwd_desc_t *fwd)
721 {
722         int             rc;
723         kqswnal_tx_t   *ktx;
724         struct iovec   *iov = fwd->kprfd_iov;
725         int             niov = fwd->kprfd_niov;
726         int             nob = fwd->kprfd_nob;
727         ptl_nid_t       nid = fwd->kprfd_gateway_nid;
728
729 #if KQSW_CHECKSUM
730         CERROR ("checksums for forwarded packets not implemented\n");
731         LBUG ();
732 #endif
733         /* The router wants this NAL to forward a packet */
734         CDEBUG (D_NET, "forwarding [%p] to "LPX64", %d frags %d bytes\n",
735                 fwd, nid, niov, nob);
736
737         LASSERT (niov > 0);
738         
739         ktx = kqswnal_get_idle_tx (fwd, FALSE);
740         if (ktx == NULL)        /* can't get txd right now */
741                 return;         /* fwd will be scheduled when tx desc freed */
742
743         if (nid == kqswnal_lib.ni.nid)          /* gateway is me */
744                 nid = fwd->kprfd_target_nid;    /* target is final dest */
745
746         if (kqswnal_nid2elanid (nid) < 0) {
747                 CERROR("Can't forward [%p] to "LPX64": not a peer\n", fwd, nid);
748                 rc = -EHOSTUNREACH;
749                 goto failed;
750         }
751
752         if (nob > KQSW_NRXMSGBYTES_LARGE) {
753                 CERROR ("Can't forward [%p] to "LPX64
754                         ": size %d bigger than max packet size %ld\n",
755                         fwd, nid, nob, (long)KQSW_NRXMSGBYTES_LARGE);
756                 rc = -EMSGSIZE;
757                 goto failed;
758         }
759
760         if ((kqswnal_fwd_copy_contig || niov > 1) &&
761             nob <= KQSW_TX_BUFFER_SIZE) 
762         {
763                 /* send from ktx's pre-allocated/mapped contiguous buffer? */
764                 lib_copy_iov2buf (ktx->ktx_buffer, niov, iov, nob);
765                 ktx->ktx_iov[0].Base = ktx->ktx_ebuffer; /* already mapped */
766                 ktx->ktx_iov[0].Len = nob;
767                 ktx->ktx_niov = 1;
768
769                 ktx->ktx_wire_hdr = (ptl_hdr_t *)ktx->ktx_buffer;
770         }
771         else
772         {
773                 /* zero copy */
774                 ktx->ktx_niov = 0;        /* no frags mapped yet */
775                 rc = kqswnal_map_tx_iov (ktx, nob, niov, iov);
776                 if (rc != 0)
777                         goto failed;
778
779                 ktx->ktx_wire_hdr = (ptl_hdr_t *)iov[0].iov_base;
780         }
781
782         ktx->ktx_port       = (nob <= (sizeof (ptl_hdr_t) + KQSW_SMALLPAYLOAD)) ?
783                               EP_SVC_LARGE_PORTALS_SMALL : EP_SVC_LARGE_PORTALS_LARGE;
784         ktx->ktx_nid        = nid;
785         ktx->ktx_forwarding = 1;
786         ktx->ktx_args[0]    = fwd;
787
788         rc = kqswnal_launch (ktx);
789         if (rc == 0)
790                 return;
791
792  failed:
793         LASSERT (rc != 0);
794         CERROR ("Failed to forward [%p] to "LPX64": %d\n", fwd, nid, rc);
795
796         kqswnal_put_idle_tx (ktx);
797         /* complete now (with failure) */
798         kpr_fwd_done (&kqswnal_data.kqn_router, fwd, rc);
799 }
800
801 void
802 kqswnal_fwd_callback (void *arg, int error)
803 {
804         kqswnal_rx_t *krx = (kqswnal_rx_t *)arg;
805
806         /* The router has finished forwarding this packet */
807
808         if (error != 0)
809         {
810                 ptl_hdr_t *hdr = (ptl_hdr_t *)page_address (krx->krx_pages[0]);
811
812                 CERROR("Failed to route packet from "LPX64" to "LPX64": %d\n",
813                        NTOH__u64(hdr->src_nid), NTOH__u64(hdr->dest_nid),error);
814         }
815
816         kqswnal_requeue_rx (krx);
817 }
818
819 void
820 kqswnal_rx (kqswnal_rx_t *krx)
821 {
822         ptl_hdr_t      *hdr = (ptl_hdr_t *) page_address (krx->krx_pages[0]);
823         ptl_nid_t       dest_nid = NTOH__u64 (hdr->dest_nid);
824         int             nob;
825         int             niov;
826
827         if (dest_nid == kqswnal_lib.ni.nid) { /* It's for me :) */
828                 /* NB krx requeued when lib_parse() calls back kqswnal_recv */
829                 lib_parse (&kqswnal_lib, hdr, krx);
830                 return;
831         }
832
833 #if KQSW_CHECKSUM
834         CERROR ("checksums for forwarded packets not implemented\n");
835         LBUG ();
836 #endif
837         if (kqswnal_nid2elanid (dest_nid) >= 0)  /* should have gone direct to peer */
838         {
839                 CERROR("dropping packet from "LPX64" for "LPX64
840                        ": target is peer\n", NTOH__u64(hdr->src_nid), dest_nid);
841                 kqswnal_requeue_rx (krx);
842                 return;
843         }
844
845         /* NB forwarding may destroy iov; rebuild every time */
846         for (nob = krx->krx_nob, niov = 0; nob > 0; nob -= PAGE_SIZE, niov++)
847         {
848                 LASSERT (niov < krx->krx_npages);
849                 krx->krx_iov[niov].iov_base= page_address(krx->krx_pages[niov]);
850                 krx->krx_iov[niov].iov_len = MIN(PAGE_SIZE, nob);
851         }
852
853         kpr_fwd_init (&krx->krx_fwd, dest_nid,
854                       krx->krx_nob, niov, krx->krx_iov,
855                       kqswnal_fwd_callback, krx);
856
857         kpr_fwd_start (&kqswnal_data.kqn_router, &krx->krx_fwd);
858 }
859
860 /* Receive Interrupt Handler: posts to schedulers */
861 void 
862 kqswnal_rxhandler(EP_RXD *rxd)
863 {
864         long          flags;
865         int           nob    = ep_rxd_len (rxd);
866         int           status = ep_rxd_status (rxd);
867         kqswnal_rx_t *krx    = (kqswnal_rx_t *)ep_rxd_arg (rxd);
868
869         CDEBUG(D_NET, "kqswnal_rxhandler: rxd %p, krx %p, nob %d, status %d\n",
870                rxd, krx, nob, status);
871
872         LASSERT (krx != NULL);
873
874         krx->krx_rxd = rxd;
875         krx->krx_nob = nob;
876
877         /* must receive a whole header to be able to parse */
878         if (status != EP_SUCCESS || nob < sizeof (ptl_hdr_t))
879         {
880                 /* receives complete with failure when receiver is removed */
881                 if (kqswnal_data.kqn_shuttingdown)
882                         return;
883
884                 CERROR("receive status failed with status %d nob %d\n",
885                        ep_rxd_status(rxd), nob);
886                 kqswnal_requeue_rx (krx);
887                 return;
888         }
889
890         atomic_inc (&kqswnal_packets_received);
891
892         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
893
894         list_add_tail (&krx->krx_list, &kqswnal_data.kqn_readyrxds);
895         if (waitqueue_active (&kqswnal_data.kqn_sched_waitq))
896                 wake_up (&kqswnal_data.kqn_sched_waitq);
897
898         spin_unlock_irqrestore (&kqswnal_data.kqn_sched_lock, flags);
899 }
900
901 #if KQSW_CHECKSUM
902 void
903 kqswnal_csum_error (kqswnal_rx_t *krx, int ishdr)
904 {
905         ptl_hdr_t *hdr = (ptl_hdr_t *)page_address (krx->krx_pages[0]);
906
907         CERROR ("%s checksum mismatch %p: dnid "LPX64", snid "LPX64
908                 ", dpid %d, spid %d, type %d\n",
909                 ishdr ? "Header" : "Payload", krx,
910                 NTOH__u64(hdr->dest_nid), NTOH__u64(hdr->src_nid)
911                 NTOH__u32(hdr->dest_pid), NTOH__u32(hdr->src_pid),
912                 NTOH__u32(hdr->type));
913
914         switch (NTOH__u32 (hdr->type))
915         {
916         case PTL_MSG_ACK:
917                 CERROR("ACK: mlen %d dmd "LPX64"."LPX64" match "LPX64
918                        " len %u\n",
919                        NTOH__u32(hdr->msg.ack.mlength),
920                        hdr->msg.ack.dst_wmd.handle_cookie,
921                        hdr->msg.ack.dst_wmd.handle_idx,
922                        NTOH__u64(hdr->msg.ack.match_bits),
923                        NTOH__u32(hdr->msg.ack.length));
924                 break;
925         case PTL_MSG_PUT:
926                 CERROR("PUT: ptl %d amd "LPX64"."LPX64" match "LPX64
927                        " len %u off %u data "LPX64"\n",
928                        NTOH__u32(hdr->msg.put.ptl_index),
929                        hdr->msg.put.ack_wmd.handle_cookie,
930                        hdr->msg.put.ack_wmd.handle_idx,
931                        NTOH__u64(hdr->msg.put.match_bits),
932                        NTOH__u32(hdr->msg.put.length),
933                        NTOH__u32(hdr->msg.put.offset),
934                        hdr->msg.put.hdr_data);
935                 break;
936         case PTL_MSG_GET:
937                 CERROR ("GET: <>\n");
938                 break;
939         case PTL_MSG_REPLY:
940                 CERROR ("REPLY: <>\n");
941                 break;
942         default:
943                 CERROR ("TYPE?: <>\n");
944         }
945 }
946 #endif
947
948 static int
949 kqswnal_recvmsg (nal_cb_t     *nal,
950                  void         *private,
951                  lib_msg_t    *cookie,
952                  unsigned int  niov,
953                  struct iovec *iov,
954                  ptl_kiov_t   *kiov,
955                  size_t        mlen,
956                  size_t        rlen)
957 {
958         kqswnal_rx_t *krx = (kqswnal_rx_t *)private;
959         int           page;
960         char         *page_ptr;
961         int           page_nob;
962         char         *iov_ptr;
963         int           iov_nob;
964         int           frag;
965 #if KQSW_CHECKSUM
966         kqsw_csum_t   senders_csum;
967         kqsw_csum_t   payload_csum = 0;
968         kqsw_csum_t   hdr_csum = kqsw_csum(0, page_address(krx->krx_pages[0]),
969                                            sizeof(ptl_hdr_t));
970         size_t        csum_len = mlen;
971         int           csum_frags = 0;
972         int           csum_nob = 0;
973         static atomic_t csum_counter;
974         int           csum_verbose = (atomic_read(&csum_counter)%1000001) == 0;
975
976         atomic_inc (&csum_counter);
977
978         memcpy (&senders_csum, ((char *)page_address (krx->krx_pages[0])) +
979                                 sizeof (ptl_hdr_t), sizeof (kqsw_csum_t));
980         if (senders_csum != hdr_csum)
981                 kqswnal_csum_error (krx, 1);
982 #endif
983         CDEBUG(D_NET,"kqswnal_recv, mlen="LPSZ", rlen="LPSZ"\n", mlen, rlen);
984
985         /* What was actually received must be >= payload.
986          * This is an LASSERT, as lib_finalize() doesn't have a completion status. */
987         LASSERT (krx->krx_nob >= KQSW_HDR_SIZE + mlen);
988         LASSERT (mlen <= rlen);
989
990         /* It must be OK to kmap() if required */
991         LASSERT (kiov == NULL || !in_interrupt ());
992         /* Either all pages or all vaddrs */
993         LASSERT (!(kiov != NULL && iov != NULL));
994         
995         if (mlen != 0)
996         {
997                 page     = 0;
998                 page_ptr = ((char *) page_address(krx->krx_pages[0])) +
999                         KQSW_HDR_SIZE;
1000                 page_nob = PAGE_SIZE - KQSW_HDR_SIZE;
1001
1002                 LASSERT (niov > 0);
1003                 if (kiov != NULL) {
1004                         iov_ptr = ((char *)kmap (kiov->kiov_page)) + kiov->kiov_offset;
1005                         iov_nob = kiov->kiov_len;
1006                 } else {
1007                         iov_ptr = iov->iov_base;
1008                         iov_nob = iov->iov_len;
1009                 }
1010
1011                 for (;;)
1012                 {
1013                         /* We expect the iov to exactly match mlen */
1014                         LASSERT (iov_nob <= mlen);
1015                         
1016                         frag = MIN (page_nob, iov_nob);
1017                         memcpy (iov_ptr, page_ptr, frag);
1018 #if KQSW_CHECKSUM
1019                         payload_csum = kqsw_csum (payload_csum, iov_ptr, frag);
1020                         csum_nob += frag;
1021                         csum_frags++;
1022 #endif
1023                         mlen -= frag;
1024                         if (mlen == 0)
1025                                 break;
1026
1027                         page_nob -= frag;
1028                         if (page_nob != 0)
1029                                 page_ptr += frag;
1030                         else
1031                         {
1032                                 page++;
1033                                 LASSERT (page < krx->krx_npages);
1034                                 page_ptr = page_address(krx->krx_pages[page]);
1035                                 page_nob = PAGE_SIZE;
1036                         }
1037
1038                         iov_nob -= frag;
1039                         if (iov_nob != 0)
1040                                 iov_ptr += frag;
1041                         else if (kiov != NULL) {
1042                                 kunmap (kiov->kiov_page);
1043                                 kiov++;
1044                                 niov--;
1045                                 LASSERT (niov > 0);
1046                                 iov_ptr = ((char *)kmap (kiov->kiov_page)) + kiov->kiov_offset;
1047                                 iov_nob = kiov->kiov_len;
1048                         } else {
1049                                 iov++;
1050                                 niov--;
1051                                 LASSERT (niov > 0);
1052                                 iov_ptr = iov->iov_base;
1053                                 iov_nob = iov->iov_len;
1054                         }
1055                 }
1056
1057                 if (kiov != NULL)
1058                         kunmap (kiov->kiov_page);
1059         }
1060
1061 #if KQSW_CHECKSUM
1062         memcpy (&senders_csum, ((char *)page_address (krx->krx_pages[0])) +
1063                 sizeof(ptl_hdr_t) + sizeof(kqsw_csum_t), sizeof(kqsw_csum_t));
1064
1065         if (csum_len != rlen)
1066                 CERROR("Unable to checksum data in user's buffer\n");
1067         else if (senders_csum != payload_csum)
1068                 kqswnal_csum_error (krx, 0);
1069
1070         if (csum_verbose)
1071                 CERROR("hdr csum %lx, payload_csum %lx, csum_frags %d, "
1072                        "csum_nob %d\n",
1073                         hdr_csum, payload_csum, csum_frags, csum_nob);
1074 #endif
1075         lib_finalize(nal, private, cookie);
1076
1077         kqswnal_requeue_rx (krx);
1078
1079         return (rlen);
1080 }
1081
1082 static int
1083 kqswnal_recv(nal_cb_t     *nal,
1084              void         *private,
1085              lib_msg_t    *cookie,
1086              unsigned int  niov,
1087              struct iovec *iov,
1088              size_t        mlen,
1089              size_t        rlen)
1090 {
1091         return (kqswnal_recvmsg (nal, private, cookie, niov, iov, NULL, mlen, rlen));
1092 }
1093
1094 static int
1095 kqswnal_recv_pages (nal_cb_t     *nal,
1096                     void         *private,
1097                     lib_msg_t    *cookie,
1098                     unsigned int  niov,
1099                     ptl_kiov_t   *kiov,
1100                     size_t        mlen,
1101                     size_t        rlen)
1102 {
1103         return (kqswnal_recvmsg (nal, private, cookie, niov, NULL, kiov, mlen, rlen));
1104 }
1105
1106 int
1107 kqswnal_thread_start (int (*fn)(void *arg), void *arg)
1108 {
1109         long    pid = kernel_thread (fn, arg, 0);
1110
1111         if (pid < 0)
1112                 return ((int)pid);
1113
1114         atomic_inc (&kqswnal_data.kqn_nthreads);
1115         return (0);
1116 }
1117
1118 void
1119 kqswnal_thread_fini (void)
1120 {
1121         atomic_dec (&kqswnal_data.kqn_nthreads);
1122 }
1123
1124 int
1125 kqswnal_scheduler (void *arg)
1126 {
1127         kqswnal_rx_t    *krx;
1128         kqswnal_tx_t    *ktx;
1129         kpr_fwd_desc_t  *fwd;
1130         long             flags;
1131         int              rc;
1132         int              counter = 0;
1133         int              did_something;
1134
1135         kportal_daemonize ("kqswnal_sched");
1136         kportal_blockallsigs ();
1137         
1138         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
1139
1140         while (!kqswnal_data.kqn_shuttingdown)
1141         {
1142                 did_something = FALSE;
1143
1144                 if (!list_empty (&kqswnal_data.kqn_readyrxds))
1145                 {
1146                         krx = list_entry(kqswnal_data.kqn_readyrxds.next,
1147                                          kqswnal_rx_t, krx_list);
1148                         list_del (&krx->krx_list);
1149                         spin_unlock_irqrestore(&kqswnal_data.kqn_sched_lock,
1150                                                flags);
1151
1152                         kqswnal_rx (krx);
1153
1154                         did_something = TRUE;
1155                         spin_lock_irqsave(&kqswnal_data.kqn_sched_lock, flags);
1156                 }
1157
1158                 if (!list_empty (&kqswnal_data.kqn_delayedtxds))
1159                 {
1160                         ktx = list_entry(kqswnal_data.kqn_delayedtxds.next,
1161                                          kqswnal_tx_t, ktx_list);
1162                         list_del_init (&ktx->ktx_delayed_list);
1163                         spin_unlock_irqrestore(&kqswnal_data.kqn_sched_lock,
1164                                                flags);
1165
1166                         rc = kqswnal_launch (ktx);
1167                         if (rc != 0)          /* failed: ktx_nid down? */
1168                         {
1169                                 CERROR("Failed delayed transmit to "LPX64
1170                                        ": %d\n", ktx->ktx_nid, rc);
1171                                 kqswnal_tx_done (ktx, rc);
1172                         }
1173
1174                         did_something = TRUE;
1175                         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
1176                 }
1177
1178                 if (!list_empty (&kqswnal_data.kqn_delayedfwds))
1179                 {
1180                         fwd = list_entry (kqswnal_data.kqn_delayedfwds.next, kpr_fwd_desc_t, kprfd_list);
1181                         list_del (&fwd->kprfd_list);
1182                         spin_unlock_irqrestore (&kqswnal_data.kqn_sched_lock, flags);
1183
1184                         kqswnal_fwd_packet (NULL, fwd);
1185
1186                         did_something = TRUE;
1187                         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
1188                 }
1189
1190                     /* nothing to do or hogging CPU */
1191                 if (!did_something || counter++ == KQSW_RESCHED) {
1192                         spin_unlock_irqrestore(&kqswnal_data.kqn_sched_lock,
1193                                                flags);
1194
1195                         counter = 0;
1196
1197                         if (!did_something) {
1198                                 rc = wait_event_interruptible (kqswnal_data.kqn_sched_waitq,
1199                                                                kqswnal_data.kqn_shuttingdown ||
1200                                                                !list_empty(&kqswnal_data.kqn_readyrxds) ||
1201                                                                !list_empty(&kqswnal_data.kqn_delayedtxds) ||
1202                                                                !list_empty(&kqswnal_data.kqn_delayedfwds));
1203                                 LASSERT (rc == 0);
1204                         } else if (current->need_resched)
1205                                 schedule ();
1206
1207                         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
1208                 }
1209         }
1210
1211         spin_unlock_irqrestore (&kqswnal_data.kqn_sched_lock, flags);
1212
1213         kqswnal_thread_fini ();
1214         return (0);
1215 }
1216
1217 nal_cb_t kqswnal_lib =
1218 {
1219         nal_data:       &kqswnal_data,         /* NAL private data */
1220         cb_send:        kqswnal_send,
1221         cb_send_pages:  kqswnal_send_pages,
1222         cb_recv:        kqswnal_recv,
1223         cb_recv_pages:  kqswnal_recv_pages,
1224         cb_read:        kqswnal_read,
1225         cb_write:       kqswnal_write,
1226         cb_malloc:      kqswnal_malloc,
1227         cb_free:        kqswnal_free,
1228         cb_printf:      kqswnal_printf,
1229         cb_cli:         kqswnal_cli,
1230         cb_sti:         kqswnal_sti,
1231         cb_dist:        kqswnal_dist
1232 };