Whamcloud - gitweb
b=1820
[fs/lustre-release.git] / lnet / klnds / qswlnd / qswlnd_cb.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * Copyright (C) 2002 Cluster File Systems, Inc.
5  *   Author: Eric Barton <eric@bartonsoftware.com>
6  *
7  * Copyright (C) 2002, Lawrence Livermore National Labs (LLNL)
8  * W. Marcus Miller - Based on ksocknal
9  *
10  * This file is part of Portals, http://www.sf.net/projects/sandiaportals/
11  *
12  * Portals is free software; you can redistribute it and/or
13  * modify it under the terms of version 2 of the GNU General Public
14  * License as published by the Free Software Foundation.
15  *
16  * Portals is distributed in the hope that it will be useful,
17  * but WITHOUT ANY WARRANTY; without even the implied warranty of
18  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
19  * GNU General Public License for more details.
20  *
21  * You should have received a copy of the GNU General Public License
22  * along with Portals; if not, write to the Free Software
23  * Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
24  *
25  */
26
27 #include "qswnal.h"
28
29 atomic_t kqswnal_packets_launched;
30 atomic_t kqswnal_packets_transmitted;
31 atomic_t kqswnal_packets_received;
32
33
34 /*
35  *  LIB functions follow
36  *
37  */
38 static int
39 kqswnal_read(nal_cb_t *nal, void *private, void *dst_addr, user_ptr src_addr,
40              size_t len)
41 {
42         CDEBUG (D_NET, LPX64": reading "LPSZ" bytes from %p -> %p\n",
43                 nal->ni.nid, len, src_addr, dst_addr );
44         memcpy( dst_addr, src_addr, len );
45
46         return (0);
47 }
48
49 static int
50 kqswnal_write(nal_cb_t *nal, void *private, user_ptr dst_addr, void *src_addr,
51               size_t len)
52 {
53         CDEBUG (D_NET, LPX64": writing "LPSZ" bytes from %p -> %p\n",
54                 nal->ni.nid, len, src_addr, dst_addr );
55         memcpy( dst_addr, src_addr, len );
56
57         return (0);
58 }
59
60 static void *
61 kqswnal_malloc(nal_cb_t *nal, size_t len)
62 {
63         void *buf;
64
65         PORTAL_ALLOC(buf, len);
66         return (buf);
67 }
68
69 static void
70 kqswnal_free(nal_cb_t *nal, void *buf, size_t len)
71 {
72         PORTAL_FREE(buf, len);
73 }
74
75 static void
76 kqswnal_printf (nal_cb_t * nal, const char *fmt, ...)
77 {
78         va_list ap;
79         char msg[256];
80
81         va_start (ap, fmt);
82         vsnprintf (msg, sizeof (msg), fmt, ap);        /* sprint safely */
83         va_end (ap);
84
85         msg[sizeof (msg) - 1] = 0;                /* ensure terminated */
86
87         CDEBUG (D_NET, "%s", msg);
88 }
89
90
91 static void
92 kqswnal_cli(nal_cb_t *nal, unsigned long *flags)
93 {
94         kqswnal_data_t *data= nal->nal_data;
95
96         spin_lock_irqsave(&data->kqn_statelock, *flags);
97 }
98
99
100 static void
101 kqswnal_sti(nal_cb_t *nal, unsigned long *flags)
102 {
103         kqswnal_data_t *data= nal->nal_data;
104
105         spin_unlock_irqrestore(&data->kqn_statelock, *flags);
106 }
107
108
109 static int
110 kqswnal_dist(nal_cb_t *nal, ptl_nid_t nid, unsigned long *dist)
111 {
112         if (nid == nal->ni.nid)
113                 *dist = 0;                      /* it's me */
114         else if (kqswnal_nid2elanid (nid) >= 0)
115                 *dist = 1;                      /* it's my peer */
116         else
117                 *dist = 2;                      /* via router */
118         return (0);
119 }
120
121 void
122 kqswnal_unmap_tx (kqswnal_tx_t *ktx)
123 {
124         if (ktx->ktx_nmappedpages == 0)
125                 return;
126
127         CDEBUG (D_NET, "%p[%d] unloading pages %d for %d\n",
128                 ktx, ktx->ktx_niov, ktx->ktx_basepage, ktx->ktx_nmappedpages);
129
130         LASSERT (ktx->ktx_nmappedpages <= ktx->ktx_npages);
131         LASSERT (ktx->ktx_basepage + ktx->ktx_nmappedpages <=
132                  kqswnal_data.kqn_eptxdmahandle->NumDvmaPages);
133
134         elan3_dvma_unload(kqswnal_data.kqn_epdev->DmaState,
135                           kqswnal_data.kqn_eptxdmahandle,
136                           ktx->ktx_basepage, ktx->ktx_nmappedpages);
137         ktx->ktx_nmappedpages = 0;
138 }
139
140 int
141 kqswnal_map_tx_kiov (kqswnal_tx_t *ktx, int nob, int niov, ptl_kiov_t *kiov)
142 {
143         int       nfrags    = ktx->ktx_niov;
144         const int maxfrags  = sizeof (ktx->ktx_iov)/sizeof (ktx->ktx_iov[0]);
145         int       nmapped   = ktx->ktx_nmappedpages;
146         int       maxmapped = ktx->ktx_npages;
147         uint32_t  basepage  = ktx->ktx_basepage + nmapped;
148         char     *ptr;
149         
150         LASSERT (nmapped <= maxmapped);
151         LASSERT (nfrags <= maxfrags);
152         LASSERT (niov > 0);
153         LASSERT (nob > 0);
154         
155         do {
156                 int  fraglen = kiov->kiov_len;
157
158                 /* nob exactly spans the iovs */
159                 LASSERT (fraglen <= nob);
160                 /* each frag fits in a page */
161                 LASSERT (kiov->kiov_offset + kiov->kiov_len <= PAGE_SIZE);
162
163                 nmapped++;
164                 if (nmapped > maxmapped) {
165                         CERROR("Can't map message in %d pages (max %d)\n",
166                                nmapped, maxmapped);
167                         return (-EMSGSIZE);
168                 }
169
170                 if (nfrags == maxfrags) {
171                         CERROR("Message too fragmented in Elan VM (max %d frags)\n",
172                                maxfrags);
173                         return (-EMSGSIZE);
174                 }
175
176                 /* XXX this is really crap, but we'll have to kmap until
177                  * EKC has a page (rather than vaddr) mapping interface */
178
179                 ptr = ((char *)kmap (kiov->kiov_page)) + kiov->kiov_offset;
180
181                 CDEBUG(D_NET,
182                        "%p[%d] loading %p for %d, page %d, %d total\n",
183                         ktx, nfrags, ptr, fraglen, basepage, nmapped);
184
185                 elan3_dvma_kaddr_load (kqswnal_data.kqn_epdev->DmaState,
186                                        kqswnal_data.kqn_eptxdmahandle,
187                                        ptr, fraglen,
188                                        basepage, &ktx->ktx_iov[nfrags].Base);
189
190                 kunmap (kiov->kiov_page);
191                 
192                 /* keep in loop for failure case */
193                 ktx->ktx_nmappedpages = nmapped;
194
195                 if (nfrags > 0 &&                /* previous frag mapped */
196                     ktx->ktx_iov[nfrags].Base == /* contiguous with this one */
197                     (ktx->ktx_iov[nfrags-1].Base + ktx->ktx_iov[nfrags-1].Len))
198                         /* just extend previous */
199                         ktx->ktx_iov[nfrags - 1].Len += fraglen;
200                 else {
201                         ktx->ktx_iov[nfrags].Len = fraglen;
202                         nfrags++;                /* new frag */
203                 }
204
205                 basepage++;
206                 kiov++;
207                 niov--;
208                 nob -= fraglen;
209
210                 /* iov must not run out before end of data */
211                 LASSERT (nob == 0 || niov > 0);
212
213         } while (nob > 0);
214
215         ktx->ktx_niov = nfrags;
216         CDEBUG (D_NET, "%p got %d frags over %d pages\n",
217                 ktx, ktx->ktx_niov, ktx->ktx_nmappedpages);
218
219         return (0);
220 }
221
222 int
223 kqswnal_map_tx_iov (kqswnal_tx_t *ktx, int nob, int niov, struct iovec *iov)
224 {
225         int       nfrags    = ktx->ktx_niov;
226         const int maxfrags  = sizeof (ktx->ktx_iov)/sizeof (ktx->ktx_iov[0]);
227         int       nmapped   = ktx->ktx_nmappedpages;
228         int       maxmapped = ktx->ktx_npages;
229         uint32_t  basepage  = ktx->ktx_basepage + nmapped;
230
231         LASSERT (nmapped <= maxmapped);
232         LASSERT (nfrags <= maxfrags);
233         LASSERT (niov > 0);
234         LASSERT (nob > 0);
235
236         do {
237                 int  fraglen = iov->iov_len;
238                 long npages  = kqswnal_pages_spanned (iov->iov_base, fraglen);
239
240                 /* nob exactly spans the iovs */
241                 LASSERT (fraglen <= nob);
242                 
243                 nmapped += npages;
244                 if (nmapped > maxmapped) {
245                         CERROR("Can't map message in %d pages (max %d)\n",
246                                nmapped, maxmapped);
247                         return (-EMSGSIZE);
248                 }
249
250                 if (nfrags == maxfrags) {
251                         CERROR("Message too fragmented in Elan VM (max %d frags)\n",
252                                maxfrags);
253                         return (-EMSGSIZE);
254                 }
255
256                 CDEBUG(D_NET,
257                        "%p[%d] loading %p for %d, pages %d for %ld, %d total\n",
258                         ktx, nfrags, iov->iov_base, fraglen, basepage, npages,
259                         nmapped);
260
261                 elan3_dvma_kaddr_load (kqswnal_data.kqn_epdev->DmaState,
262                                        kqswnal_data.kqn_eptxdmahandle,
263                                        iov->iov_base, fraglen,
264                                        basepage, &ktx->ktx_iov[nfrags].Base);
265                 /* keep in loop for failure case */
266                 ktx->ktx_nmappedpages = nmapped;
267
268                 if (nfrags > 0 &&                /* previous frag mapped */
269                     ktx->ktx_iov[nfrags].Base == /* contiguous with this one */
270                     (ktx->ktx_iov[nfrags-1].Base + ktx->ktx_iov[nfrags-1].Len))
271                         /* just extend previous */
272                         ktx->ktx_iov[nfrags - 1].Len += fraglen;
273                 else {
274                         ktx->ktx_iov[nfrags].Len = fraglen;
275                         nfrags++;                /* new frag */
276                 }
277
278                 basepage += npages;
279                 iov++;
280                 niov--;
281                 nob -= fraglen;
282
283                 /* iov must not run out before end of data */
284                 LASSERT (nob == 0 || niov > 0);
285
286         } while (nob > 0);
287
288         ktx->ktx_niov = nfrags;
289         CDEBUG (D_NET, "%p got %d frags over %d pages\n",
290                 ktx, ktx->ktx_niov, ktx->ktx_nmappedpages);
291
292         return (0);
293 }
294
295 void
296 kqswnal_put_idle_tx (kqswnal_tx_t *ktx)
297 {
298         kpr_fwd_desc_t   *fwd = NULL;
299         unsigned long     flags;
300
301         kqswnal_unmap_tx (ktx);                 /* release temporary mappings */
302
303         spin_lock_irqsave (&kqswnal_data.kqn_idletxd_lock, flags);
304
305         list_del (&ktx->ktx_list);              /* take off active list */
306
307         if (ktx->ktx_isnblk) {
308                 /* reserved for non-blocking tx */
309                 list_add (&ktx->ktx_list, &kqswnal_data.kqn_nblk_idletxds);
310                 spin_unlock_irqrestore (&kqswnal_data.kqn_idletxd_lock, flags);
311                 return;
312         }
313
314         list_add (&ktx->ktx_list, &kqswnal_data.kqn_idletxds);
315
316         /* anything blocking for a tx descriptor? */
317         if (!list_empty(&kqswnal_data.kqn_idletxd_fwdq)) /* forwarded packet? */
318         {
319                 CDEBUG(D_NET,"wakeup fwd\n");
320
321                 fwd = list_entry (kqswnal_data.kqn_idletxd_fwdq.next,
322                                   kpr_fwd_desc_t, kprfd_list);
323                 list_del (&fwd->kprfd_list);
324         }
325
326         if (waitqueue_active (&kqswnal_data.kqn_idletxd_waitq))  /* process? */
327         {
328                 /* local sender waiting for tx desc */
329                 CDEBUG(D_NET,"wakeup process\n");
330                 wake_up (&kqswnal_data.kqn_idletxd_waitq);
331         }
332
333         spin_unlock_irqrestore (&kqswnal_data.kqn_idletxd_lock, flags);
334
335         if (fwd == NULL)
336                 return;
337
338         /* schedule packet for forwarding again */
339         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
340
341         list_add_tail (&fwd->kprfd_list, &kqswnal_data.kqn_delayedfwds);
342         if (waitqueue_active (&kqswnal_data.kqn_sched_waitq))
343                 wake_up (&kqswnal_data.kqn_sched_waitq);
344
345         spin_unlock_irqrestore (&kqswnal_data.kqn_sched_lock, flags);
346 }
347
348 kqswnal_tx_t *
349 kqswnal_get_idle_tx (kpr_fwd_desc_t *fwd, int may_block)
350 {
351         unsigned long  flags;
352         kqswnal_tx_t  *ktx = NULL;
353
354         for (;;) {
355                 spin_lock_irqsave (&kqswnal_data.kqn_idletxd_lock, flags);
356
357                 /* "normal" descriptor is free */
358                 if (!list_empty (&kqswnal_data.kqn_idletxds)) {
359                         ktx = list_entry (kqswnal_data.kqn_idletxds.next,
360                                           kqswnal_tx_t, ktx_list);
361                         break;
362                 }
363
364                 /* "normal" descriptor pool is empty */
365
366                 if (fwd != NULL) { /* forwarded packet => queue for idle txd */
367                         CDEBUG (D_NET, "blocked fwd [%p]\n", fwd);
368                         list_add_tail (&fwd->kprfd_list,
369                                        &kqswnal_data.kqn_idletxd_fwdq);
370                         break;
371                 }
372
373                 /* doing a local transmit */
374                 if (!may_block) {
375                         if (list_empty (&kqswnal_data.kqn_nblk_idletxds)) {
376                                 CERROR ("intr tx desc pool exhausted\n");
377                                 break;
378                         }
379
380                         ktx = list_entry (kqswnal_data.kqn_nblk_idletxds.next,
381                                           kqswnal_tx_t, ktx_list);
382                         break;
383                 }
384
385                 /* block for idle tx */
386
387                 spin_unlock_irqrestore (&kqswnal_data.kqn_idletxd_lock, flags);
388
389                 CDEBUG (D_NET, "blocking for tx desc\n");
390                 wait_event (kqswnal_data.kqn_idletxd_waitq,
391                             !list_empty (&kqswnal_data.kqn_idletxds));
392         }
393
394         if (ktx != NULL) {
395                 list_del (&ktx->ktx_list);
396                 list_add (&ktx->ktx_list, &kqswnal_data.kqn_activetxds);
397                 ktx->ktx_launcher = current->pid;
398         }
399
400         spin_unlock_irqrestore (&kqswnal_data.kqn_idletxd_lock, flags);
401
402         /* Idle descs can't have any mapped (as opposed to pre-mapped) pages */
403         LASSERT (ktx == NULL || ktx->ktx_nmappedpages == 0);
404         return (ktx);
405 }
406
407 void
408 kqswnal_tx_done (kqswnal_tx_t *ktx, int error)
409 {
410         if (ktx->ktx_forwarding)                /* router asked me to forward this packet */
411                 kpr_fwd_done (&kqswnal_data.kqn_router,
412                               (kpr_fwd_desc_t *)ktx->ktx_args[0], error);
413         else                                    /* packet sourced locally */
414                 lib_finalize (&kqswnal_lib, ktx->ktx_args[0],
415                               (lib_msg_t *)ktx->ktx_args[1]);
416
417         kqswnal_put_idle_tx (ktx);
418 }
419
420 static void
421 kqswnal_txhandler(EP_TXD *txd, void *arg, int status)
422 {
423         kqswnal_tx_t      *ktx = (kqswnal_tx_t *)arg;
424
425         LASSERT (txd != NULL);
426         LASSERT (ktx != NULL);
427
428         CDEBUG(D_NET, "txd %p, arg %p status %d\n", txd, arg, status);
429
430         if (status == EP_SUCCESS)
431                 atomic_inc (&kqswnal_packets_transmitted);
432
433         if (status != EP_SUCCESS)
434         {
435                 CERROR ("kqswnal: Transmit failed with %d\n", status);
436                 status = -EIO;
437         }
438
439         kqswnal_tx_done (ktx, status);
440 }
441
442 int
443 kqswnal_launch (kqswnal_tx_t *ktx)
444 {
445         /* Don't block for transmit descriptor if we're in interrupt context */
446         int   attr = in_interrupt() ? (EP_NO_SLEEP | EP_NO_ALLOC) : 0;
447         int   dest = kqswnal_nid2elanid (ktx->ktx_nid);
448         long  flags;
449         int   rc;
450         
451         LASSERT (dest >= 0);                    /* must be a peer */
452         rc = ep_transmit_large(kqswnal_data.kqn_eptx, dest,
453                                ktx->ktx_port, attr, kqswnal_txhandler,
454                                ktx, ktx->ktx_iov, ktx->ktx_niov);
455         if (rc == 0)
456                 atomic_inc (&kqswnal_packets_launched);
457
458         if (rc != ENOMEM)
459                 return (rc);
460
461         /* can't allocate ep txd => queue for later */
462
463         LASSERT (in_interrupt());      /* not called by thread (not looping) */
464
465         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
466
467         list_add_tail (&ktx->ktx_delayed_list, &kqswnal_data.kqn_delayedtxds);
468         if (waitqueue_active (&kqswnal_data.kqn_sched_waitq))
469                 wake_up (&kqswnal_data.kqn_sched_waitq);
470
471         spin_unlock_irqrestore (&kqswnal_data.kqn_sched_lock, flags);
472
473         return (0);
474 }
475
476
477 static char *
478 hdr_type_string (ptl_hdr_t *hdr)
479 {
480         switch (hdr->type) {
481         case PTL_MSG_ACK:
482                 return ("ACK");
483         case PTL_MSG_PUT:
484                 return ("PUT");
485         case PTL_MSG_GET:
486                 return ("GET");
487         case PTL_MSG_REPLY:
488                 return ("REPLY");
489         default:
490                 return ("<UNKNOWN>");
491         }
492 }
493
494 static void
495 kqswnal_cerror_hdr(ptl_hdr_t * hdr)
496 {
497         char *type_str = hdr_type_string (hdr);
498
499         CERROR("P3 Header at %p of type %s\n", hdr, type_str);
500         CERROR("    From nid/pid "LPU64"/%u", NTOH__u64(hdr->src_nid),
501                NTOH__u32(hdr->src_pid));
502         CERROR("    To nid/pid "LPU64"/%u\n", NTOH__u64(hdr->dest_nid),
503                NTOH__u32(hdr->dest_pid));
504
505         switch (NTOH__u32(hdr->type)) {
506         case PTL_MSG_PUT:
507                 CERROR("    Ptl index %d, ack md "LPX64"."LPX64", "
508                        "match bits "LPX64"\n",
509                        NTOH__u32 (hdr->msg.put.ptl_index),
510                        hdr->msg.put.ack_wmd.wh_interface_cookie,
511                        hdr->msg.put.ack_wmd.wh_object_cookie,
512                        NTOH__u64 (hdr->msg.put.match_bits));
513                 CERROR("    Length %d, offset %d, hdr data "LPX64"\n",
514                        NTOH__u32(PTL_HDR_LENGTH(hdr)),
515                        NTOH__u32(hdr->msg.put.offset),
516                        hdr->msg.put.hdr_data);
517                 break;
518
519         case PTL_MSG_GET:
520                 CERROR("    Ptl index %d, return md "LPX64"."LPX64", "
521                        "match bits "LPX64"\n",
522                        NTOH__u32 (hdr->msg.get.ptl_index),
523                        hdr->msg.get.return_wmd.wh_interface_cookie,
524                        hdr->msg.get.return_wmd.wh_object_cookie,
525                        hdr->msg.get.match_bits);
526                 CERROR("    Length %d, src offset %d\n",
527                        NTOH__u32 (hdr->msg.get.sink_length),
528                        NTOH__u32 (hdr->msg.get.src_offset));
529                 break;
530
531         case PTL_MSG_ACK:
532                 CERROR("    dst md "LPX64"."LPX64", manipulated length %d\n",
533                        hdr->msg.ack.dst_wmd.wh_interface_cookie,
534                        hdr->msg.ack.dst_wmd.wh_object_cookie,
535                        NTOH__u32 (hdr->msg.ack.mlength));
536                 break;
537
538         case PTL_MSG_REPLY:
539                 CERROR("    dst md "LPX64"."LPX64", length %d\n",
540                        hdr->msg.reply.dst_wmd.wh_interface_cookie,
541                        hdr->msg.reply.dst_wmd.wh_object_cookie,
542                        NTOH__u32 (PTL_HDR_LENGTH(hdr)));
543         }
544
545 }                               /* end of print_hdr() */
546
547 static int
548 kqswnal_sendmsg (nal_cb_t     *nal,
549                  void         *private,
550                  lib_msg_t    *cookie,
551                  ptl_hdr_t    *hdr,
552                  int           type,
553                  ptl_nid_t     nid,
554                  ptl_pid_t     pid,
555                  unsigned int  payload_niov,
556                  struct iovec *payload_iov,
557                  ptl_kiov_t   *payload_kiov,
558                  size_t        payload_nob)
559 {
560         kqswnal_tx_t      *ktx;
561         int                rc;
562         ptl_nid_t          gatewaynid;
563 #if KQSW_CHECKSUM
564         int                i;
565         kqsw_csum_t        csum;
566         int                sumnob;
567 #endif
568         
569         CDEBUG(D_NET, "sending "LPSZ" bytes in %d frags to nid: "LPX64
570                " pid %u\n", payload_nob, payload_niov, nid, pid);
571
572         LASSERT (payload_nob == 0 || payload_niov > 0);
573         LASSERT (payload_niov <= PTL_MD_MAX_IOV);
574
575         /* It must be OK to kmap() if required */
576         LASSERT (payload_kiov == NULL || !in_interrupt ());
577         /* payload is either all vaddrs or all pages */
578         LASSERT (!(payload_kiov != NULL && payload_iov != NULL));
579         
580         if (payload_nob > KQSW_MAXPAYLOAD) {
581                 CERROR ("request exceeds MTU size "LPSZ" (max %u).\n",
582                         payload_nob, KQSW_MAXPAYLOAD);
583                 return (PTL_FAIL);
584         }
585
586         if (kqswnal_nid2elanid (nid) < 0) {     /* Can't send direct: find gateway? */
587                 rc = kpr_lookup (&kqswnal_data.kqn_router, nid, &gatewaynid);
588                 if (rc != 0) {
589                         CERROR("Can't route to "LPX64": router error %d\n",
590                                nid, rc);
591                         return (PTL_FAIL);
592                 }
593                 if (kqswnal_nid2elanid (gatewaynid) < 0) {
594                         CERROR("Bad gateway "LPX64" for "LPX64"\n",
595                                gatewaynid, nid);
596                         return (PTL_FAIL);
597                 }
598                 nid = gatewaynid;
599         }
600
601         /* I may not block for a transmit descriptor if I might block the
602          * receiver, or an interrupt handler. */
603         ktx = kqswnal_get_idle_tx(NULL, !(type == PTL_MSG_ACK ||
604                                           type == PTL_MSG_REPLY ||
605                                           in_interrupt()));
606         if (ktx == NULL) {
607                 kqswnal_cerror_hdr (hdr);
608                 return (PTL_NOSPACE);
609         }
610
611         memcpy (ktx->ktx_buffer, hdr, sizeof (*hdr)); /* copy hdr from caller's stack */
612         ktx->ktx_wire_hdr = (ptl_hdr_t *)ktx->ktx_buffer;
613
614 #if KQSW_CHECKSUM
615         csum = kqsw_csum (0, (char *)hdr, sizeof (*hdr));
616         memcpy (ktx->ktx_buffer + sizeof (*hdr), &csum, sizeof (csum));
617         for (csum = 0, i = 0, sumnob = payload_nob; sumnob > 0; i++) {
618                 if (payload_kiov != NULL) {
619                         ptl_kiov_t *kiov = &payload_kiov[i];
620                         char       *addr = ((char *)kmap (kiov->kiov_page)) +
621                                            kiov->kiov_offset;
622                         
623                         csum = kqsw_csum (csum, addr, MIN (sumnob, kiov->kiov_len));
624                         sumnob -= kiov->kiov_len;
625                 } else {
626                         struct iovec *iov = &payload_iov[i];
627
628                         csum = kqsw_csum (csum, iov->iov_base, MIN (sumnob, kiov->iov_len));
629                         sumnob -= iov->iov_len;
630                 }
631         }
632         memcpy(ktx->ktx_buffer +sizeof(*hdr) +sizeof(csum), &csum,sizeof(csum));
633 #endif
634
635         /* Set up first frag from pre-mapped buffer (it's at least the
636          * portals header) */
637         ktx->ktx_iov[0].Base = ktx->ktx_ebuffer;
638         ktx->ktx_iov[0].Len = KQSW_HDR_SIZE;
639         ktx->ktx_niov = 1;
640
641         if (payload_nob > 0) { /* got some payload (something more to do) */
642                 /* make a single contiguous message? */
643                 if (payload_nob <= KQSW_TX_MAXCONTIG) {
644                         /* copy payload to ktx_buffer, immediately after hdr */
645                         if (payload_kiov != NULL)
646                                 lib_copy_kiov2buf (ktx->ktx_buffer + KQSW_HDR_SIZE,
647                                                    payload_niov, payload_kiov, payload_nob);
648                         else
649                                 lib_copy_iov2buf (ktx->ktx_buffer + KQSW_HDR_SIZE,
650                                                   payload_niov, payload_iov, payload_nob);
651                         /* first frag includes payload */
652                         ktx->ktx_iov[0].Len += payload_nob;
653                 } else {
654                         if (payload_kiov != NULL)
655                                 rc = kqswnal_map_tx_kiov (ktx, payload_nob, 
656                                                           payload_niov, payload_kiov);
657                         else
658                                 rc = kqswnal_map_tx_iov (ktx, payload_nob,
659                                                          payload_niov, payload_iov);
660                         if (rc != 0) {
661                                 kqswnal_put_idle_tx (ktx);
662                                 return (PTL_FAIL);
663                         }
664                 } 
665         }
666
667         ktx->ktx_port       = (payload_nob <= KQSW_SMALLPAYLOAD) ?
668                               EP_SVC_LARGE_PORTALS_SMALL : EP_SVC_LARGE_PORTALS_LARGE;
669         ktx->ktx_nid        = nid;
670         ktx->ktx_forwarding = 0;   /* => lib_finalize() on completion */
671         ktx->ktx_args[0]    = private;
672         ktx->ktx_args[1]    = cookie;
673
674         rc = kqswnal_launch (ktx);
675         if (rc != 0) {                    /* failed? */
676                 CERROR ("Failed to send packet to "LPX64": %d\n", nid, rc);
677                 return (PTL_FAIL);
678         }
679
680         CDEBUG(D_NET, "send to "LPSZ" bytes to "LPX64"\n", payload_nob, nid);
681         return (PTL_OK);
682 }
683
684 static int
685 kqswnal_send (nal_cb_t     *nal,
686               void         *private,
687               lib_msg_t    *cookie,
688               ptl_hdr_t    *hdr,
689               int           type,
690               ptl_nid_t     nid,
691               ptl_pid_t     pid,
692               unsigned int  payload_niov,
693               struct iovec *payload_iov,
694               size_t        payload_nob)
695 {
696         return (kqswnal_sendmsg (nal, private, cookie, hdr, type, nid, pid,
697                                  payload_niov, payload_iov, NULL, payload_nob));
698 }
699
700 static int
701 kqswnal_send_pages (nal_cb_t     *nal,
702                     void         *private,
703                     lib_msg_t    *cookie,
704                     ptl_hdr_t    *hdr,
705                     int           type,
706                     ptl_nid_t     nid,
707                     ptl_pid_t     pid,
708                     unsigned int  payload_niov,
709                     ptl_kiov_t   *payload_kiov,
710                     size_t        payload_nob)
711 {
712         return (kqswnal_sendmsg (nal, private, cookie, hdr, type, nid, pid,
713                                  payload_niov, NULL, payload_kiov, payload_nob));
714 }
715
716 int kqswnal_fwd_copy_contig = 0;
717
718 void
719 kqswnal_fwd_packet (void *arg, kpr_fwd_desc_t *fwd)
720 {
721         int             rc;
722         kqswnal_tx_t   *ktx;
723         struct iovec   *iov = fwd->kprfd_iov;
724         int             niov = fwd->kprfd_niov;
725         int             nob = fwd->kprfd_nob;
726         ptl_nid_t       nid = fwd->kprfd_gateway_nid;
727
728 #if KQSW_CHECKSUM
729         CERROR ("checksums for forwarded packets not implemented\n");
730         LBUG ();
731 #endif
732         /* The router wants this NAL to forward a packet */
733         CDEBUG (D_NET, "forwarding [%p] to "LPX64", %d frags %d bytes\n",
734                 fwd, nid, niov, nob);
735
736         LASSERT (niov > 0);
737         
738         ktx = kqswnal_get_idle_tx (fwd, FALSE);
739         if (ktx == NULL)        /* can't get txd right now */
740                 return;         /* fwd will be scheduled when tx desc freed */
741
742         if (nid == kqswnal_lib.ni.nid)          /* gateway is me */
743                 nid = fwd->kprfd_target_nid;    /* target is final dest */
744
745         if (kqswnal_nid2elanid (nid) < 0) {
746                 CERROR("Can't forward [%p] to "LPX64": not a peer\n", fwd, nid);
747                 rc = -EHOSTUNREACH;
748                 goto failed;
749         }
750
751         if (nob > KQSW_NRXMSGBYTES_LARGE) {
752                 CERROR ("Can't forward [%p] to "LPX64
753                         ": size %d bigger than max packet size %ld\n",
754                         fwd, nid, nob, (long)KQSW_NRXMSGBYTES_LARGE);
755                 rc = -EMSGSIZE;
756                 goto failed;
757         }
758
759         if ((kqswnal_fwd_copy_contig || niov > 1) &&
760             nob <= KQSW_TX_BUFFER_SIZE) 
761         {
762                 /* send from ktx's pre-allocated/mapped contiguous buffer? */
763                 lib_copy_iov2buf (ktx->ktx_buffer, niov, iov, nob);
764                 ktx->ktx_iov[0].Base = ktx->ktx_ebuffer; /* already mapped */
765                 ktx->ktx_iov[0].Len = nob;
766                 ktx->ktx_niov = 1;
767
768                 ktx->ktx_wire_hdr = (ptl_hdr_t *)ktx->ktx_buffer;
769         }
770         else
771         {
772                 /* zero copy */
773                 ktx->ktx_niov = 0;        /* no frags mapped yet */
774                 rc = kqswnal_map_tx_iov (ktx, nob, niov, iov);
775                 if (rc != 0)
776                         goto failed;
777
778                 ktx->ktx_wire_hdr = (ptl_hdr_t *)iov[0].iov_base;
779         }
780
781         ktx->ktx_port       = (nob <= (sizeof (ptl_hdr_t) + KQSW_SMALLPAYLOAD)) ?
782                               EP_SVC_LARGE_PORTALS_SMALL : EP_SVC_LARGE_PORTALS_LARGE;
783         ktx->ktx_nid        = nid;
784         ktx->ktx_forwarding = 1;
785         ktx->ktx_args[0]    = fwd;
786
787         rc = kqswnal_launch (ktx);
788         if (rc == 0)
789                 return;
790
791  failed:
792         LASSERT (rc != 0);
793         CERROR ("Failed to forward [%p] to "LPX64": %d\n", fwd, nid, rc);
794
795         kqswnal_put_idle_tx (ktx);
796         /* complete now (with failure) */
797         kpr_fwd_done (&kqswnal_data.kqn_router, fwd, rc);
798 }
799
800 void
801 kqswnal_fwd_callback (void *arg, int error)
802 {
803         kqswnal_rx_t *krx = (kqswnal_rx_t *)arg;
804
805         /* The router has finished forwarding this packet */
806
807         if (error != 0)
808         {
809                 ptl_hdr_t *hdr = (ptl_hdr_t *)page_address (krx->krx_pages[0]);
810
811                 CERROR("Failed to route packet from "LPX64" to "LPX64": %d\n",
812                        NTOH__u64(hdr->src_nid), NTOH__u64(hdr->dest_nid),error);
813         }
814
815         kqswnal_requeue_rx (krx);
816 }
817
818 void
819 kqswnal_rx (kqswnal_rx_t *krx)
820 {
821         ptl_hdr_t      *hdr = (ptl_hdr_t *) page_address (krx->krx_pages[0]);
822         ptl_nid_t       dest_nid = NTOH__u64 (hdr->dest_nid);
823         int             nob;
824         int             niov;
825
826         if (dest_nid == kqswnal_lib.ni.nid) { /* It's for me :) */
827                 /* NB krx requeued when lib_parse() calls back kqswnal_recv */
828                 lib_parse (&kqswnal_lib, hdr, krx);
829                 return;
830         }
831
832 #if KQSW_CHECKSUM
833         CERROR ("checksums for forwarded packets not implemented\n");
834         LBUG ();
835 #endif
836         if (kqswnal_nid2elanid (dest_nid) >= 0)  /* should have gone direct to peer */
837         {
838                 CERROR("dropping packet from "LPX64" for "LPX64
839                        ": target is peer\n", NTOH__u64(hdr->src_nid), dest_nid);
840                 kqswnal_requeue_rx (krx);
841                 return;
842         }
843
844         /* NB forwarding may destroy iov; rebuild every time */
845         for (nob = krx->krx_nob, niov = 0; nob > 0; nob -= PAGE_SIZE, niov++)
846         {
847                 LASSERT (niov < krx->krx_npages);
848                 krx->krx_iov[niov].iov_base= page_address(krx->krx_pages[niov]);
849                 krx->krx_iov[niov].iov_len = MIN(PAGE_SIZE, nob);
850         }
851
852         kpr_fwd_init (&krx->krx_fwd, dest_nid,
853                       krx->krx_nob, niov, krx->krx_iov,
854                       kqswnal_fwd_callback, krx);
855
856         kpr_fwd_start (&kqswnal_data.kqn_router, &krx->krx_fwd);
857 }
858
859 /* Receive Interrupt Handler: posts to schedulers */
860 void 
861 kqswnal_rxhandler(EP_RXD *rxd)
862 {
863         long          flags;
864         int           nob    = ep_rxd_len (rxd);
865         int           status = ep_rxd_status (rxd);
866         kqswnal_rx_t *krx    = (kqswnal_rx_t *)ep_rxd_arg (rxd);
867
868         CDEBUG(D_NET, "kqswnal_rxhandler: rxd %p, krx %p, nob %d, status %d\n",
869                rxd, krx, nob, status);
870
871         LASSERT (krx != NULL);
872
873         krx->krx_rxd = rxd;
874         krx->krx_nob = nob;
875
876         /* must receive a whole header to be able to parse */
877         if (status != EP_SUCCESS || nob < sizeof (ptl_hdr_t))
878         {
879                 /* receives complete with failure when receiver is removed */
880                 if (kqswnal_data.kqn_shuttingdown)
881                         return;
882
883                 CERROR("receive status failed with status %d nob %d\n",
884                        ep_rxd_status(rxd), nob);
885                 kqswnal_requeue_rx (krx);
886                 return;
887         }
888
889         atomic_inc (&kqswnal_packets_received);
890
891         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
892
893         list_add_tail (&krx->krx_list, &kqswnal_data.kqn_readyrxds);
894         if (waitqueue_active (&kqswnal_data.kqn_sched_waitq))
895                 wake_up (&kqswnal_data.kqn_sched_waitq);
896
897         spin_unlock_irqrestore (&kqswnal_data.kqn_sched_lock, flags);
898 }
899
900 #if KQSW_CHECKSUM
901 void
902 kqswnal_csum_error (kqswnal_rx_t *krx, int ishdr)
903 {
904         ptl_hdr_t *hdr = (ptl_hdr_t *)page_address (krx->krx_pages[0]);
905
906         CERROR ("%s checksum mismatch %p: dnid "LPX64", snid "LPX64
907                 ", dpid %d, spid %d, type %d\n",
908                 ishdr ? "Header" : "Payload", krx,
909                 NTOH__u64(hdr->dest_nid), NTOH__u64(hdr->src_nid)
910                 NTOH__u32(hdr->dest_pid), NTOH__u32(hdr->src_pid),
911                 NTOH__u32(hdr->type));
912
913         switch (NTOH__u32 (hdr->type))
914         {
915         case PTL_MSG_ACK:
916                 CERROR("ACK: mlen %d dmd "LPX64"."LPX64" match "LPX64
917                        " len %u\n",
918                        NTOH__u32(hdr->msg.ack.mlength),
919                        hdr->msg.ack.dst_wmd.handle_cookie,
920                        hdr->msg.ack.dst_wmd.handle_idx,
921                        NTOH__u64(hdr->msg.ack.match_bits),
922                        NTOH__u32(hdr->msg.ack.length));
923                 break;
924         case PTL_MSG_PUT:
925                 CERROR("PUT: ptl %d amd "LPX64"."LPX64" match "LPX64
926                        " len %u off %u data "LPX64"\n",
927                        NTOH__u32(hdr->msg.put.ptl_index),
928                        hdr->msg.put.ack_wmd.handle_cookie,
929                        hdr->msg.put.ack_wmd.handle_idx,
930                        NTOH__u64(hdr->msg.put.match_bits),
931                        NTOH__u32(hdr->msg.put.length),
932                        NTOH__u32(hdr->msg.put.offset),
933                        hdr->msg.put.hdr_data);
934                 break;
935         case PTL_MSG_GET:
936                 CERROR ("GET: <>\n");
937                 break;
938         case PTL_MSG_REPLY:
939                 CERROR ("REPLY: <>\n");
940                 break;
941         default:
942                 CERROR ("TYPE?: <>\n");
943         }
944 }
945 #endif
946
947 static int
948 kqswnal_recvmsg (nal_cb_t     *nal,
949                  void         *private,
950                  lib_msg_t    *cookie,
951                  unsigned int  niov,
952                  struct iovec *iov,
953                  ptl_kiov_t   *kiov,
954                  size_t        mlen,
955                  size_t        rlen)
956 {
957         kqswnal_rx_t *krx = (kqswnal_rx_t *)private;
958         int           page;
959         char         *page_ptr;
960         int           page_nob;
961         char         *iov_ptr;
962         int           iov_nob;
963         int           frag;
964 #if KQSW_CHECKSUM
965         kqsw_csum_t   senders_csum;
966         kqsw_csum_t   payload_csum = 0;
967         kqsw_csum_t   hdr_csum = kqsw_csum(0, page_address(krx->krx_pages[0]),
968                                            sizeof(ptl_hdr_t));
969         size_t        csum_len = mlen;
970         int           csum_frags = 0;
971         int           csum_nob = 0;
972         static atomic_t csum_counter;
973         int           csum_verbose = (atomic_read(&csum_counter)%1000001) == 0;
974
975         atomic_inc (&csum_counter);
976
977         memcpy (&senders_csum, ((char *)page_address (krx->krx_pages[0])) +
978                                 sizeof (ptl_hdr_t), sizeof (kqsw_csum_t));
979         if (senders_csum != hdr_csum)
980                 kqswnal_csum_error (krx, 1);
981 #endif
982         CDEBUG(D_NET,"kqswnal_recv, mlen="LPSZ", rlen="LPSZ"\n", mlen, rlen);
983
984         /* What was actually received must be >= payload.
985          * This is an LASSERT, as lib_finalize() doesn't have a completion status. */
986         LASSERT (krx->krx_nob >= KQSW_HDR_SIZE + mlen);
987         LASSERT (mlen <= rlen);
988
989         /* It must be OK to kmap() if required */
990         LASSERT (kiov == NULL || !in_interrupt ());
991         /* Either all pages or all vaddrs */
992         LASSERT (!(kiov != NULL && iov != NULL));
993         
994         if (mlen != 0)
995         {
996                 page     = 0;
997                 page_ptr = ((char *) page_address(krx->krx_pages[0])) +
998                         KQSW_HDR_SIZE;
999                 page_nob = PAGE_SIZE - KQSW_HDR_SIZE;
1000
1001                 LASSERT (niov > 0);
1002                 if (kiov != NULL) {
1003                         iov_ptr = ((char *)kmap (kiov->kiov_page)) + kiov->kiov_offset;
1004                         iov_nob = kiov->kiov_len;
1005                 } else {
1006                         iov_ptr = iov->iov_base;
1007                         iov_nob = iov->iov_len;
1008                 }
1009
1010                 for (;;)
1011                 {
1012                         /* We expect the iov to exactly match mlen */
1013                         LASSERT (iov_nob <= mlen);
1014                         
1015                         frag = MIN (page_nob, iov_nob);
1016                         memcpy (iov_ptr, page_ptr, frag);
1017 #if KQSW_CHECKSUM
1018                         payload_csum = kqsw_csum (payload_csum, iov_ptr, frag);
1019                         csum_nob += frag;
1020                         csum_frags++;
1021 #endif
1022                         mlen -= frag;
1023                         if (mlen == 0)
1024                                 break;
1025
1026                         page_nob -= frag;
1027                         if (page_nob != 0)
1028                                 page_ptr += frag;
1029                         else
1030                         {
1031                                 page++;
1032                                 LASSERT (page < krx->krx_npages);
1033                                 page_ptr = page_address(krx->krx_pages[page]);
1034                                 page_nob = PAGE_SIZE;
1035                         }
1036
1037                         iov_nob -= frag;
1038                         if (iov_nob != 0)
1039                                 iov_ptr += frag;
1040                         else if (kiov != NULL) {
1041                                 kunmap (kiov->kiov_page);
1042                                 kiov++;
1043                                 niov--;
1044                                 LASSERT (niov > 0);
1045                                 iov_ptr = ((char *)kmap (kiov->kiov_page)) + kiov->kiov_offset;
1046                                 iov_nob = kiov->kiov_len;
1047                         } else {
1048                                 iov++;
1049                                 niov--;
1050                                 LASSERT (niov > 0);
1051                                 iov_ptr = iov->iov_base;
1052                                 iov_nob = iov->iov_len;
1053                         }
1054                 }
1055
1056                 if (kiov != NULL)
1057                         kunmap (kiov->kiov_page);
1058         }
1059
1060 #if KQSW_CHECKSUM
1061         memcpy (&senders_csum, ((char *)page_address (krx->krx_pages[0])) +
1062                 sizeof(ptl_hdr_t) + sizeof(kqsw_csum_t), sizeof(kqsw_csum_t));
1063
1064         if (csum_len != rlen)
1065                 CERROR("Unable to checksum data in user's buffer\n");
1066         else if (senders_csum != payload_csum)
1067                 kqswnal_csum_error (krx, 0);
1068
1069         if (csum_verbose)
1070                 CERROR("hdr csum %lx, payload_csum %lx, csum_frags %d, "
1071                        "csum_nob %d\n",
1072                         hdr_csum, payload_csum, csum_frags, csum_nob);
1073 #endif
1074         lib_finalize(nal, private, cookie);
1075
1076         kqswnal_requeue_rx (krx);
1077
1078         return (rlen);
1079 }
1080
1081 static int
1082 kqswnal_recv(nal_cb_t     *nal,
1083              void         *private,
1084              lib_msg_t    *cookie,
1085              unsigned int  niov,
1086              struct iovec *iov,
1087              size_t        mlen,
1088              size_t        rlen)
1089 {
1090         return (kqswnal_recvmsg (nal, private, cookie, niov, iov, NULL, mlen, rlen));
1091 }
1092
1093 static int
1094 kqswnal_recv_pages (nal_cb_t     *nal,
1095                     void         *private,
1096                     lib_msg_t    *cookie,
1097                     unsigned int  niov,
1098                     ptl_kiov_t   *kiov,
1099                     size_t        mlen,
1100                     size_t        rlen)
1101 {
1102         return (kqswnal_recvmsg (nal, private, cookie, niov, NULL, kiov, mlen, rlen));
1103 }
1104
1105 int
1106 kqswnal_thread_start (int (*fn)(void *arg), void *arg)
1107 {
1108         long    pid = kernel_thread (fn, arg, 0);
1109
1110         if (pid < 0)
1111                 return ((int)pid);
1112
1113         atomic_inc (&kqswnal_data.kqn_nthreads);
1114         return (0);
1115 }
1116
1117 void
1118 kqswnal_thread_fini (void)
1119 {
1120         atomic_dec (&kqswnal_data.kqn_nthreads);
1121 }
1122
1123 int
1124 kqswnal_scheduler (void *arg)
1125 {
1126         kqswnal_rx_t    *krx;
1127         kqswnal_tx_t    *ktx;
1128         kpr_fwd_desc_t  *fwd;
1129         long             flags;
1130         int              rc;
1131         int              counter = 0;
1132         int              did_something;
1133
1134         kportal_daemonize ("kqswnal_sched");
1135         kportal_blockallsigs ();
1136         
1137         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
1138
1139         while (!kqswnal_data.kqn_shuttingdown)
1140         {
1141                 did_something = FALSE;
1142
1143                 if (!list_empty (&kqswnal_data.kqn_readyrxds))
1144                 {
1145                         krx = list_entry(kqswnal_data.kqn_readyrxds.next,
1146                                          kqswnal_rx_t, krx_list);
1147                         list_del (&krx->krx_list);
1148                         spin_unlock_irqrestore(&kqswnal_data.kqn_sched_lock,
1149                                                flags);
1150
1151                         kqswnal_rx (krx);
1152
1153                         did_something = TRUE;
1154                         spin_lock_irqsave(&kqswnal_data.kqn_sched_lock, flags);
1155                 }
1156
1157                 if (!list_empty (&kqswnal_data.kqn_delayedtxds))
1158                 {
1159                         ktx = list_entry(kqswnal_data.kqn_delayedtxds.next,
1160                                          kqswnal_tx_t, ktx_list);
1161                         list_del_init (&ktx->ktx_delayed_list);
1162                         spin_unlock_irqrestore(&kqswnal_data.kqn_sched_lock,
1163                                                flags);
1164
1165                         rc = kqswnal_launch (ktx);
1166                         if (rc != 0)          /* failed: ktx_nid down? */
1167                         {
1168                                 CERROR("Failed delayed transmit to "LPX64
1169                                        ": %d\n", ktx->ktx_nid, rc);
1170                                 kqswnal_tx_done (ktx, rc);
1171                         }
1172
1173                         did_something = TRUE;
1174                         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
1175                 }
1176
1177                 if (!list_empty (&kqswnal_data.kqn_delayedfwds))
1178                 {
1179                         fwd = list_entry (kqswnal_data.kqn_delayedfwds.next, kpr_fwd_desc_t, kprfd_list);
1180                         list_del (&fwd->kprfd_list);
1181                         spin_unlock_irqrestore (&kqswnal_data.kqn_sched_lock, flags);
1182
1183                         kqswnal_fwd_packet (NULL, fwd);
1184
1185                         did_something = TRUE;
1186                         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
1187                 }
1188
1189                     /* nothing to do or hogging CPU */
1190                 if (!did_something || counter++ == KQSW_RESCHED) {
1191                         spin_unlock_irqrestore(&kqswnal_data.kqn_sched_lock,
1192                                                flags);
1193
1194                         counter = 0;
1195
1196                         if (!did_something) {
1197                                 rc = wait_event_interruptible (kqswnal_data.kqn_sched_waitq,
1198                                                                kqswnal_data.kqn_shuttingdown ||
1199                                                                !list_empty(&kqswnal_data.kqn_readyrxds) ||
1200                                                                !list_empty(&kqswnal_data.kqn_delayedtxds) ||
1201                                                                !list_empty(&kqswnal_data.kqn_delayedfwds));
1202                                 LASSERT (rc == 0);
1203                         } else if (current->need_resched)
1204                                 schedule ();
1205
1206                         spin_lock_irqsave (&kqswnal_data.kqn_sched_lock, flags);
1207                 }
1208         }
1209
1210         spin_unlock_irqrestore (&kqswnal_data.kqn_sched_lock, flags);
1211
1212         kqswnal_thread_fini ();
1213         return (0);
1214 }
1215
1216 nal_cb_t kqswnal_lib =
1217 {
1218         nal_data:       &kqswnal_data,         /* NAL private data */
1219         cb_send:        kqswnal_send,
1220         cb_send_pages:  kqswnal_send_pages,
1221         cb_recv:        kqswnal_recv,
1222         cb_recv_pages:  kqswnal_recv_pages,
1223         cb_read:        kqswnal_read,
1224         cb_write:       kqswnal_write,
1225         cb_malloc:      kqswnal_malloc,
1226         cb_free:        kqswnal_free,
1227         cb_printf:      kqswnal_printf,
1228         cb_cli:         kqswnal_cli,
1229         cb_sti:         kqswnal_sti,
1230         cb_dist:        kqswnal_dist
1231 };